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Nuc 1 e ins aur emo 1 ekiil e , codierend Proteine, die die 
Knochenentwicklung beeinflussen 



Die vorliegende Erfindung betrifft Nucleinsauretnolekule co- 
dierend Proteine, die die Knochenentwicklung in Saugern be- 
einflussen, die codierten Proteine, sowie diagnostische und 
pharmazeutische Zusammenset zungen enthaltend derartige 
Nucleinsauremolekiile oder Proteine. Die Erfindung betrifft 
ferner transgene nicht -menschliche Sauger, die mit den be- 
schriebenen Nucleinsauremolekiilen transf ormiert sind oder 
die eine veranderte Expression der beschriebenen Proteine 
auf weisen . 



Beim Menschen sind eine Reihe von Erbkrankheiten bekannt , 
die zu Wachstums- und Entwicklungsstorungen der Knochen ftih- 
ren . Hierzu zahlen beispielsweise spondyloepiphysare Dyspla- 
sien und Achondroplasie . Die genauen genetischen Ursachen 
derartiger Storungen sind in der Regel nicht geklart und 
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therapeut ische Ansatze oder diagnostische Verfahren zur 
Friiherkennung stehen groEtenteils nicht zur Verfiigung. 
Die Aufklarung der Ursachen solcher Wachstums- und Entwick- 
lungsstorungen sowie die Bereitstellung moglicher therapeu- 
tischer Ansatze und Diagnost ikverf ahren zur fruhzeitigen Er- 
kennung solcher Storungen erfordert die Ident if izierung und 
Isolierung von Genen, die an der Regulation ent sprechender 
Wachstums- und Entwicklungsprozesse beteiligt sind. 

Der vorliegenden Erfindung liegt somit die Aufgabe zugrunde , 
Nucleinsauremolekiile zur Verfiigung zu stellen, deren Expres- 
sionsprodukt Wachstums- und Entwicklungsprozesse, insbeson- 
dere im Zusammenhang mit Knochen, bei Tieren und Menschen 
beeinfluSt. 

Diese Aufgabe wird durch die Bereitstellung der in den Pa- 
tentanspriichen bezeichneten Ausf iihrungsf ormen gelost . 

Somit betrifft die vorliegende Erfindung Nucleinsauremole- 
kiile, die eine Nucleot idsequenz umfassen, die die in Seq ID 
No. 2 oder in Seq ID No . 4 dargestellte Aminosauresequenz 
codiert, sowie Nucleinsauremolekiile, die die in Seq ID No. 1 
oder Seq ID No. 3 dargestellte Nucleot idsequenz umfassen. Es 
wurde iiberraschenderweise gefunden, daS das von einem sol- 
chen Nucleinsauremolekiil codierte Protein ein Protein ist, 
dessen Inakt ivierung in Saugern zu einer Verlangerung der 
Knochen mit Ausnahme der Schadelknochen f iihrt . Auf gefunden 
wurden derartige Nucleinsauremolekiie im Zusammenhang mit der 
Erzeugung einer sogenannten transgenen "Donor " -Maus , d.h. 
einer Maus, die als Spender fiir ein kunstliches Protein die- 
nen sollte. Dieses kiinstliche Protein sollte in bestimmten 
Geweben der "Donor" -Maus exprimiert werden, ohne jedoch in 
dieser Maus eine Funktion zu haben . Erst nach Kreuzung der 
Donor-Maus mit einer geeigneten transgenen Empf anger-Maus 
sollte das Protein wirksam werden und bestimmte Gene der 
Empf anger-Maus aktivieren. Transgene Donor-Mause sind schon 
des ofteren erzeugt worden . Normalerweise zeigen sie keinen 
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Phanotyp, da das kiinstliche Gen einfach in befruchtete Ei- 
zellen gespritzt wird und sich rein zufallig in irgendeinem 
Bereich des murinen Genoms integriert . Da lediglich etwa 5 % 
des Genoms codierend sind, ist die Wahrscheinlichkeit , daS 
ein Defekt in einem essentiellen Gen verursacht wird ent- 
sprechend gering. Hinzu kommt , dalS das Saugergenom diploid 
ist, d.h. alle Gene sind in doppelter Ausfiihrung vorhanden. 
Daher sind die meisten Mutationen rezessiv, d.h. sie kommen 
nicht zur Auspragung: dem mutierten Gen steht eine voll 
funktionsf ahige Kopie gegeniiber, die den erzeugten Defekt 
kompensieren kann . 

^^^^^ Uberraschenderweise zeigte die erzeugte Donormaus einen 
extrem auffalligen Phanotyp: alle Knochen (mit Ausnahme der 
des Schadels) sind urn das 1,3- bis 1,5-fache verlangert . In- 
folgedessen ist die transgene Maus etwa 1,5 mal langer als 
der entsprechende Wildtyp (siehe Fig. 1) . Dieser Phanotyp 
ist dominant und wird stabil weitervererbt , d.h. bei Kreu- 
zung einer transgenen Mutane mit einer gesunden Wildtyp-Maus 
zeigen 50 % der Nachkommen den oben beschriebenen Phanotyp. 
Die genetische Analyse dieser Maus ergab, daS durch die 
Insertion der DNA fur das in der Maus zu produzierende 
kiinstliche Protein in das Genom der Maus ein Gen inaktiviert 
wurde . Urn herauszuf inden, welches Gen (oder welche Gene) fur 
den beobachteten Phanotyp verantwortlich sind, wurde der mu- 
tierte Bereich des Genoms der transgenen Maus in Bakterien 
subcloniert. Die Lokalisierung des mutierten Bereiches im 
Genom der Maus und die anschlieSende Subclonierung waren 
moglich, weil die Nucleot idsequenz des eingefiihrten kiinstli- 
chen Gens bekannt war und diese Information in entsprechen- 
den molekularbiologischen Experimenten genutzt werden 
konnte . 

Zur Identif izierung des Gens, das im folgenden LOBO-Gen 
("long bones" ) genannt wird, wurden 6 kb aus dem subclonier- 
ten Bereich der transgenen Maus sowie 87 kb aus der entspre- 
chenden homologen Region der Wildtyp-Maus sequenziert. Eine 
detaillierte Computeranalyse der Sequenzdaten fuhrte zur 
Identif izierung eines Gens, das aus mindestens 8 codierenden 



Abschnitten ("Exons") besteht und mindestens 60 000 Basen 
lang ist, wahrscheinlich aber sehr viel langer. Der bisher 
ident if izierte , codierende Bereich tragt die Information fur 
393 Aminosauren (siehe Seq ID No. 2) . Aufgrund der erhalte- 
nen murinen Sequenzdaten wurde eine DNA- Sonde konstruiert, 
mit deren Hilfe ein humaner PI Clon isoliert wurde, der das 
menschliche LOBO-homologe Gen tragt. Die Sequenz der bisher 
isolierten und identif izierten codierenden Bereiche (Exons) 
dieses Gens ist in Seq ID No. 3 dargestellt, ebenso wie die 
davon abgeleitete Aminosauresequenz . Ein Sequenzvergleich 
der erhaltenen murinen und menschlichen Sequenzen mit be- 
kannten Sequenzen ergab, daS das codierte Protein eine ge- 
wisse Homologie zu einem Protein aus C. elegans hat. Da das 
Protein aus C. elegans am N-Terminus ca. 400 Aminosauren 
langer ist als das von den bisher in Maus identif izierten 
Sequenzen codierte Protein, ist zu vermuten, daS das murine 
LOBO-Gen weitere Sequenzen umfafet und bisher nur partiell 
sequenziert wurde. Mit Hilfe der durch die vorliegende Er- 
findung zur Verfugung gestellten Sequenzdaten ist es jedoch 
moglich mittels Standardverf ahren, z.B. chromosomal walking, 
die noch fehlenden Bereiche des Gens zu isolieren und zu 
charakterisieren . 

Aus dem oben gesagten ergibt sich, daS die erf indungsgemaSen 
Nucleinsauremolekule ein Protein codieren, dessen Inaktivie- 
rung in Tieren, vorzugsweise in Vertebraten, bevorzugt in 
Saugern und besonders bevorzugt in Maus zu einer Verlange- 
rung der Knochen mit Ausnahme der Schadelknochen f iihren . 
Eine Verlangerung bedeutet dabei vorzugsweise eine Verlange- 
rung um einen Faktor von mindestens 1,2, bevorzugt um einen 
Faktor von 1,3 und besonders bevorzugt um einen Faktor im 
Bereich von 1,3 bis 1,5. 

Der Begriff " Inaktivierung" bedeutet dabei, daS die Expres- 
sion des Proteins im Vergleich zum Wildtyp verringert ist, 
vorzugsweise um mindestens 50 % und besonders bevorzugt to- 
tal reprimiert ist . Die Analyse der Mutation im Genom der 
oben beschriebenen - Donormaus ergab, daS sich -die Insertion 



des kiinstlichen Gens innerhalb eines Introns des LOBO-Gens 
befindet und zur Deletion von 10 Basenpaaren gefuhrt hat. 
Letzteres sollte im Intron kein Problem bereiten, da dieser 
Bereich ohnehin nicht codiert . Es ist daher anzunehmen, daS 
es aufgrund der kiinstlichen DNA- Insert ion zur Storung bei 
der Reifung der mRNA koramt ("splicing"), da das kiinstlich 
eingefuhrte Gen Splicing-Signale enthalt. Dies fiihrt vermut- 
lich zu einem sogenannten "aberranten splicing" . Infolgedes- 
sen wird die Bildung einer f unktionsf ahigen mRNA verhindert 
und das ent sprechende Protein kann nicht produziert werden. 
Tatsachlich hat die experimentelle Uberpriifung der LOBO-Ex- 
pression (durch "Northern Blot") ergeben, daS in heterozygo- 
ten LOBO-Mausen nur noch etwa die Halfte an mRNA produziert 
wird, im Vergleich zur Wildtyp-Maus . In homozygoten LOBO- 
Mausen kann iiberhaupt keine LOBO-mRNA mehr nachgewiesen wer- 
den-. Es ist daher anzunehmen, daS die Mutation in der trans- 
genen LOBO-Maus die Genexpression auf post- transkript ionaler 
Ebene abschaltet . Offenbar sinkt dann bereits in den hetero- 
zygoten Mausen die Menge an produziertem LOBO-Protein unter 
einen kritischen Schwellenwert , was dann zu dem beobachte- 
ten, dominanten Phanotyp fiihrt. 

Der Begriff " Inakt ivierung" bedeutet daher im Rahmen der 
vorliegenden Erfindung vorzugsweise , daS die Menge an Trans - 
kripten, die das beschriebene Protein codieren, in den Zel- 
len im Vergleich zu Zellen von ent sprechenden Wildtyp-Tieren 
um mindestens 50 % verringert ist, vorzugsweise um minde- 
stens 70 %, besonders bevorzugt um mindestens 90 % . In einer 
ganz besonders bevorzugten Ausf iihrungsf orm bedeutet "Inakti- 
vierung" , date keinerlei Transkripte mehr nachgewiesen werden 
konnen, die das beschriebene Protein codieren. Die Menge an 
Transkripten kann nach dem Fachmann bekannten Techniken 
nachgewiesen werden, beispielsweise durch Northern Blot-Ana- 
lyse . 

Vorzugsweise fiihrt die Inaktivierung des durch die erfin- 
dungsgemaSen Nucleinsauremolektile codierten Proteins in Mau- 



6 



sen weiterhin zu mindestens einer der folgenden Veranderun- 



gen : 



(a) die Wandung der Knochen ist mindestens doppelt so dick 
wie bei Wildtyp-Mausen (siehe Figur 4) ; 

(b) das Knochenmark enthalt wesentlich weniger stabilisie- 
rende Elemente als Knochen von Wildtyp-Mausen (siehe Fi- 
gur 4 ) ; 

(c) die Knochen sind bruchiger als Knochen von Wildtyp-Mau- 
sen ; 

(d) die Lebenserwartung ist drastisch verkvirzt, betragt ma- 
ximal 40 Wochen und durchschnitt lich ca . 25 Wochen (be! 
Wildtyp-Mausen liegt die durchschnittliche Lebenserwar- 
tung bei 1 bis 2 Jahren) . 

Der Vergleich der Aminosauresequenz des durch die erfin- 
dungsgemafien Nucleinsauremolekule codierten Proteins zeigte, 
daS die Aminosauresequenz Bereiche aufweist, die zwischen 
Mensch und Maus stark konserviert sind und die auch in Pro- 
teinen aus Saccharomyces cerevisiae, Schizosaccharomyces 
pombe, aus einem Bakterium der Gattung Leuconostoc und aus 
Caenorhabditis elegans vorkommen. Von dem verwandten Protein 
aus S. cerevisiae, Dis3, ist bekannt, daS es eine Rolle in 
der zellzykluskontrolle spielt . Die Funktion der anderen ho- 
mologen Proteine ist bisher nicht bekannt. Das Vorhandensein 
von verwandten Proteinen in Bakterien als auch in Hefen und 
C. elegans laSt vermuten, daS die erf indungsgemaSen Nuclein- 
sauremolekiile ein Protein codieren, dafi eine zentrale Rolle 
auf zytologischer Ebene spielt. Das in der vorliegenden Er- 
findung beschriebene Nucleinsauremolekiil aus der Maus 
scheint eine wesentliche Rolle in der murinen Individalent- 
wicklung zu spielen, denn die Verlangerung der Knochen in 
der Mutante ist bereits direkt nach der Geburt sichtbar und 
wird dann mit zunehmendem Alter der Tiere immer dramatx- 
scher. Das iibersteigerte Knochenwachstum konnte endokrinolo- 
gische Ursachen haben, d.h. das LOBO-Gen konnte ein Wachs- 
tumshormon produzieren oder die Produktion eines solchen 
Hormons durch Steuerung anderer Gene kontrollieren oder 
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selbst ein Rezeptor fur Wachstumshormone sein. All dies ist 
aber unwahrscheinlich, da bisher keinerlei Sequenzhomologien 
zu einer der genannten Proteinklassen gefunden wurde . Dage- 
gen scheint es aufgrund der oben gezeigten Homologie zum 
Dis3 -Gen aus S. cerevisiae wahrscheinlicher , daS durch die 
Mutation im LOBO-Gen die Steuerung der Zellteilung (Mitose) 
gestort wird und es daher zu verandertem Wachstum kommt . 
Somit ist die Bereitstellung der erf indungsgemaSen Nuclein- 
sauremolekule sowohl wissenschaf t lich als auch klinisch von 
groSer Bedeutung . Seine weitere Erforschung konnte zum einen 
helfen, die Zellzykluskontrolle noch besser zu verstehen. 
Dies ist insbesondere fur die Krebsf orschung wichtig. Zum 
anderen konnten die erf indungsgemaSen Nucleinsauremolekule 
fur humane Wachstumsstorungen verantwort lich sein, die nicht 
ernahrungs- oder hormonbedingt sind. 

Die vorliegende Erfindung betrifft auch Nucleinsauremole- 
kule, deren komplementarer Strang mit einem der obenbe- 
schriebenen erf indungsgemaSen Nucleinsauremolekule hybridi- 
siert und die ein Protein mit den obengenannten Eigenschaf- 
ten codieren. 

Der Begriff " Hybridisierung" bedeutet im Rahmen der vorlie- 
genden Erfindung eine Hybridisierung unter konventionellen 
Hybridisierungsbedingungen, vorzugsweise unter stringenten 
Bedingungen, wie sie beispielsweise in Sambrock et al . , 
Molecular Cloning, A Laboratory Manual, 2. Aufl. (1989) Cold 
Spring Harbor Laboratory Press, Cold Spring Harbor, NY) be- 
schrieben sind. Dabei bedeutet " stringent e Bedingungen", date 
eine Hybridisierung nur erfolgt, wenn eine Sequenzidentitat 
von mindestens 90 %, vorzugsweise von mindestens 95 % und 
besonders bevorzugt von mindestens 97 % iiber die gesamte 
Lange vorliegt . Nucleinsauremolekule, die mit den erf in- 
dungsgemaSen Nucleinsauremolekulen hybridisieren , konnen 
prinzipiell aus jedem beliebigen tierischen Organismus stam- 
men, der ein derartiges Protein exprimiert . Vorzugsweise 
sind es Molekiile, die entsprechende Proteine aus hoheren 
tierischen Organismen codieren, bevorzugt aus Vertebraten, 



besonders bevorzugt aus Saugern und insbesondere aus Maus 
oder Mensch. 

Nucleinsauremolekiile, die mit den erf indungsgemaSen Molekii- 
len hybridisieren, konnen z.B. aus genomischen oder aus 
cDNA-Bibliotheken isoliert werden. Die Ident if izierung und 
Isolierung derartiger Nucleinsauremolekiile kann dabei unter 
Verwendung der erf indungsgemaSen Nucleinsauremolekiile oder 
Teile dieser Molekiile bzw. der reversen Komplemente dieser 
Molekiile erfolgen, z.B. mittels Hybridisierung nach 
Standardverf ahren (siehe z.B. Sambrook et al . , 1989, 
Molecular Cloning, A Laboratory Manual, 2. Auf 1 . Cold Spring 
Harbor Laboratory Press, Cold Spring Harbor, NY) oder durch 
Amplif ikation mittels PCR . 

Als Hybridisierungsprobe konnen z.B. Nucleinsauremolekiile 
verwendet werden, die exakt die oder im wesentlichen die un- 
ter Seq ID No . 1 oder 3 angegebene Nucleot idsequenz oder 
Teile dieser Sequenz aufweisen. Bei den als Hybridisierungs- 
probe verwendeten Fragmenten kann es sich auch um syntheti- 
sche Fragmente handeln, die mit Hilfe der gangigen Synthese- 
techniken hergestellt wurden und deren Sequenz im wesentli- 
chen mit der eines erf indungsgemaSen Nucleinsauremolekiils 
tibereinstimmt . Hat man Gene ident if iziert und isoliert, die 
mit den erf indungsgemaSen Nucleinsauresequenzen hybridisie- 
ren, sollte eine Bestimmung der Sequenz und eine Analyse der 
Eigenschaf ten der von dieser Sequenz codierten Proteine er- 
f olgen . 

Die mit den erf indungsgemaSen Nucleinsauremolekiilen hybridi- 
sierenden Molekiile umfassen insbesondere Fragmente, Derivate 
und allelische Varianten der oben beschriebenen Nucleinsau- 
remolekiile, die ein Protein mit den vorstehend beschriebenen 
Eigenschaf ten codieren. Der Ausdruck Derivat bedeutet in 
diesem Zusammenhang, daS die Sequenzen dieser Molekiile sich 
von den Sequenzen der oben beschriebenen Nucleinsauremole- 
kiile an einer oder mehreren Positionen unterscheiden und 
einen hohen Grad an Homologie zu diesen Sequenzen aufweisen. 
Homologie bedeutet dabei eine Sequenzident itat auf Aminosau- 
reebene iiber die gesamte Lange von mindestens 70 %, insbe- 




sondere eine Identitat von mindestens 80 %, vorzugsweise 
iiber 90 %, besonders bevorzugt uber 95 % und insbesondere 
von mindestens 97 %. Vorzugsweise bedeutet Homologie ferner 
eine Sequenzidentitat auf der Nucleinsauresequenzebene von 
mindestens 60 %, vorzugsweise mindestens 70 %, besonders be- 
vorzugt mindestens 85 % und insbesondere bevorzugt von min- 
destens 95 %. Die Abweichungen zu den oben beschriebenen 
Nucleinsauremolekulen konnen dabei z.B. durch Deletion, Ad- 
dition, Substitution, Insertion oder Rekombinat ion entstan- 
den sein. 

Homologie bedeutet ferner, daS funktionelle und/oder struk- 
turelle Aquivalenz zwischen den betreffenden Nucleinsauremo- 
lekulen oder den durch sie codierten Proteinen, besteht. Bei 
den Nucleinsauremolekulen, die homolog zu den oben beschrie- 
benen Molekulen sind und Derivate dieser Molekule darstel- 
len, handelt es sich in der Regel urn Variationen dieser Mo- 
lekule, die Modif ikationen darstellen, die dieselbe biologi- 
sche Funktion ausiiben . Es kann sich dabei sowohl urn natiirli- 
cherweise auftretende Variationen handeln, beispielsweise urn 
Sequenzen aus anderen Tierarten, oder urn Mutationen , wobei 
diese Mutationen auf natiirliche Weise aufgetreten sein kon- 
nen oder durch gezielte Mutagenese eingefiihrt wurden. Ferner 
kann es sich bei den Variationen urn synthetisch hergestellte 
Sequenzen handeln. Bei den allelischen Varianten kann es 
sich sowohl urn natiirlich auftretende Varianten handeln, als 
auch urn synthetisch hergestellte oder durch rekombinante 
DNA-Techniken erzeugte Varianten. 

Die von den verschiedenen Varianten der erf indungsgemaSen 
Nucleinsauremolekule codierten Proteine weisen bestimmte ge- 
meinsame Charakterist ika auf. Dazu konnen z.B. biologische 
Aktivitat, Molekulargewicht , immunologische Reaktivitat, 
Konformation etc. gehoren, sowie physikalische Eigenschaf ten 
wie z.B. das Lauf verhalten in Gelelektrophoresen , chromato- 
graphisches Verhalten, Sedimentat ionskoef f izienten, Loslich- 
keit, spektroskopische Eigenschaf ten , Stabilitat; pH-Opti- 
mum, Temperatur-Optimum etc. 



10 



Die Proteine, die von den erf indungsgemaSen Nucleinsauremo- 
lekiilen codiert werden, weisen vorzugsweise dieselbe biolo- 
gische Funktion oder Aktivitat auf wie oben fur das murine 
Protein beschrieben, d.h. bei Inakt ivierung dieser Proteine 
in Tieren kommt es zur oben beschriebenen Veranderung der 
Knochenentwicklung . 

Besonders bevorzugt weist das durch ein erf indungsgemaSes 
Nucleinsauremolekul codierte Protein mindestens eine der 
beiden folgenden Konsensussequenzen auf. 
Konsensus 1 : 

EFMLLANXXVAXX I XXXF PXXALLRRHXX P 
Konsensus 2 : 

H Z ALNVXX ZTHFTSPIRRZXDVI VHRLLAAALGY 

Die vorliegende Erfindung betrifft ferner Nucleinsauremole- 
kiile deren Sequenz von der Sequenz eines oben beschriebenen 
Nucleinsauremolekuls aufgrund der Degeneration des geneti- 
schen Codes abweicht . 

Die erf indungsgemaSen Nucleinsauremolekiile konnen beliebige 
Nucleinsauremolekiile sein, insbesondere DNA- oder RNA-Mole- 
kiile, beispielsweise cDNA, genomische DNA, mRNA etc. Sie 
konnen naturlich vorkommende Molekiile sein, oder durch gen- 
technische oder chemische Syntheseverf ahren hergestellte Mo- 
lekiile. 

Beispiele fiir genomische Sequenzen der Maus und des Menschen 
sind in Seq ID No . 5, 6 und 7 dargestellt. Mit Hilfe von 
"fluorescent in situ hybridization" (Fish) an kompletten mu- 
rinen Metaphasechromosomen wurde das murine Gen in der Bande 
ID auf dem Chromosomen 1 der Maus lokalisiert. Diese Bande 
ist mit der Bande 2q35 auf dem humanen Chromosom 2 homolog. 
In diesem Abschnitt befindet sich auch ein Gen fiir alkali- 
sche Phosphatase, dessen Position in der Literatur genau be- 
kannt ist . Die Analyse der genomischen Sequenzen aus Maus 
und Mensch, die ein erf indungsgemaSes Nucleinsauremolekul 
tragen, ergab, daS sich in beiden Fallen das Gen fiir die al- 
kalische Phosphatase ca . 20 kb stromabwarts des LOBO-Gens 
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befindet, so daS dessen chromosomale Lokalisation sehr genau 
angegeben werden kann. Mit Hilfe der in der vorliegenden Er- 
findung offenbarten Nucleinsauremolekiile ist es dem Fachmann 
moglich, mittels bekannter Verfahren homologe Sequenzen aus 
anderen Organismen, insbesondere Saugern zu isolieren. 

Weiterhin betrifft die Erfindung Vektoren, insbesondere 
Plasmide, Cosmide, Viren, Bacteriophagen und andere in der 
Gentechnik gangige Vektoren, die die oben beschriebenen er- 
f indungsgemaSen Nucleinsauremolekiile enthalten. 

In einer bevorzugten Ausf uhrungsf orm sind die in den Vekto- 
ren enthaltenen Nucleinsauremolekiile verkniipft mit regulato- 
rischen Elementen, die die Expression in prokaryontischen 
oder eukaryontischen Zellen gewahrleisten . Der Begriff "Ex- 
pression" kann dabei Transkription als auch Transkription 
und Translation bedeuten. Regulatorische Elemente umfassen 
dabei insbesondere Promotoren. Fur die Expression eines er- 
f indungsgemaSen Nucleinsauremolekiils in prokaryontischen 
Zellen stehen eine Reihe von Promotoren zur Verfiigung, z.B. 
der E. coli lac- oder trp-Promotor , der P R - oder P L -Promotor 
des Lambda -Phagen, lad, lacZ, T3 , T7, gpt , etc. Eukaryonti- 
sche Promotoren sind beispielsweise der CMV immediate early- 
Promotor, der HSV-Promotor , der Thymidinkinase - Promotor , der 
SV40 -Promotor , LTRs von Retroviren und der Maus Metallo- 
thioninl -Promotor . Es ist bereits eine Vielzahl von Expres- 
sionsvektoren fiir die Expression in prokaryontischen oder 
eukaryontischen Zellen beschrieben, z.B. fiir Eukaryonten 
PKK223-3 (Pharmcia Fine Chemicals, Uppsala, Sweden) or GEM1 
{Promega Biotec, Madison, WI , USA), pSV2CAT, pOG44 und fiir 
Prokaryonten pQE70, pQE60, pBluescript SK, etc. Neben Promo- 
toren konnen erf indungsgemafie Vektoren auch Elemente zur 
weiteren Steigerung der Transkription enthalten, wie z.B. 
sogenannte Transkriptions-Enhancer . Beispiele dafur sind der 
SV4 0 -Enhancer, der Polyoma-Enhancer , der Cytomegalovirus 
early promoter-Enhancer und Adenovirus -Enhancer . 



Die vorliegende Erfindung betrifft ferner Wirtszellen, ins- 
besondere prokaryontische oder eukaryontische Wirtszellen, 
die mit einem erf indungsgemaSen Nucleinsauremolekiil oder 
Vektor transf ormiert sind. Beispiele fur solche Zellen sind 
bakterielle Zellen, wie z.B. E. coli, Streptomyces , Bacil- 
lus, Salmonella typhitnurium; Pilzzellen, wie beispielsweise 
Hefezellen, insbesondere Saccharomyces cerevisiae; Insekten- 
zellen, wie z.B. Drosophila- oder SF9-Zellen; tierische Zel- 
len, wie z.B. CHO oder COS-Zellen; Pf lanzenzellen etc. 

Weiterhin betrifft die vorliegende Erfindung ein Verfahren 
zur Herstellung eines Proteins, das von einem erf indungsge- 
maSen Nucleinsauremolekiil codiert wird, wobei eine erfin- 
dungsgemaSe Wirtszelle unter Bedingungen kultiviert wird, 
die die Expression des Proteins erlauben, und das Protein 
anschlieSend aus den Zellen und/oder dem Kulturmedium gewon- 
nen wird. Verfahren zur Expression von Fremdproteinen in 
verschiedenen Arten von Wirtszellen sowie zur Gewinnung des 
produzierten Proteins sind dem Fachmann gelaufig. 

Gegenstand der Erfindung ist ferner ein Protein, das von 
einem erf indungsgemaSen Nucleinsauremolekul codiert wird 
oder das durch ein erf indungsgemaSes Verfahren erhaltlich 
ist . 

Ferner betrifft die vorliegende Erfindung Antikorper, die 
gegen die erf indungsgemaSen Proteine gerichtet sind. Vor- 
zugsweise erkennen solche Antikorper spezifisch ein erfin- 
dungsgemaSes Protein, d.h. sie zeigen keine nennenswerte 
Kreuzreakt ion mit anderen Proteinen. Der Begriff "Antikor- 
per" umfaSt dabei sowohl monoclonale als auch polyclonale 
Antikorper, ebenso wie Fragmente von Antikorpern, wobei 
diese Fragmente ein erf indungsgemaSes Protein erkennen, z.B. 
Fab -Fragmente . Der Begriff Antikorper umfaSt ebenfalls chi- 
mare Antikorper sowie humanisierte Antikorper. Verfahren zur 
Herstellung von monoclonalen oder polyclonalen Antikorpern 
sind dem Fachmann gelaufig und sind beschrieben. Zur Her- 
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stellung von monoclonalen Antikorpern kann beispielsweise 
die Hybridoma-Technik (Kohler und Milstein, Nature 256 

(1975) , 495-497) , die Trioma-Technik, die menschliche B- 
Zellhybridom-Technik (Kozbor et al . , Immunology Today 4 

(1983), 72) oder die EBV-Hybridoma-Technik (Cole et al . , 
Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc. 

(1985) , 77-96) verwendet werden. 

Ferner betrifft die vorliegende Erfindung Nucleinsauremole- 
kule von mindestens 15, vorzugsweise mehr als 50 und beson- 
ders bevorzugt mehr als 200 Nucleotiden Lange, die spezi- 
fisch mit einem Strang eines erf indungsgemaSen Nucleinsaure- 
molekuls hybridisieren. Spezifisch hybridisieren bedeutet 
hierbei, daS diese Molekiile mit Nucleinsauremolekulen hybri- 
disieren, die ein erf indungsgemafees Protein codieren, jedoch 
nicht mit Nucleinsauremolekulen, die andere Proteine codie- 
ren. Hybridisieren bedeutet dabei vorzugsweise Hybridisieren 
unter stringenten Bedingungen (s.o.). Solche Nucleinsauremo- 
lekule konnen beispielsweise als Primer fur die Amplifika- 
tion mittels PCR oder als Hybridisierungsproben verwendet 
werden. Insbesondere betrifft die Erfindung solche Nuclein- 
sauremolekule, die mit Transkripten von erf indungsgemaSen 
Nucleinsauremolekulen hybridisieren und dadurch deren Trans- 
lation verhindern konnen. Solche Nucleinsauremolekule konnen 
beispielsweise Bestandteile von ant isense-Konstrukten oder 
Ribozymen sein. 

Ferner betrifft die vorliegende Erfindung diagnostische Zu- 
sammensetzungen enthaltend ein erf indungsgemaSes Nucleinsau- 
remolekul oder Vektor, ein erf indungsgemaSes Protein 
und/oder einen erf indungsgemaiSen Antikorper. Die erfindungs- 
gemaSen Nucleinsauremolekule konnen beispielsweise einge- 
setzt werden, urn die Lokalisation des ent sprechenden Gens 
auf einem Chromosom zu bestimmen. Dies kann AufschluS iiber 
die Korrelation mit Genen geben, die mit bestimmten Krank- 
heiten assoziiert sind. eine Methode zur Bestimmung der Lo- 
kalisation ist beispielsweise die "Fluorescent in situ hy- 
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bridisation" (Fish) beschrieben in Verma et al . (Human 
Chromosomes: A Manual of Basic Techniques, Pergamon Press, 
New York (1988) ) . Weiterhin konnen erf indungsgemaSe Nuclein- 
sauremolekule verwendet werden, urn f estzustellen, ob be- 
stimmte Individuen Mutat ionen in den ent sprechenden Sequen- 
zen aufweisen. Ebenso konnen Antikorper als Nachweisreagen- 
zien fur die Anwesenheit eines erf indungsgemaSen Proteins in 
einer Probe verwendet werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung sind 
pharmazeutische Zusammensetzungen, die ein erf indungsgemaSes 
Nucleinsauremolekiil, einen erf indungsgemaSen Vektor, ein er- 
f indungsgemaSes Protein und/oder einen erf indungsgemaSen 
Antikorper enthalten, gegebenenf alls in Kombination mit 
einem pharmazeutisch vertraglichen Trager. So konnen bei- 
spielsweise erf indungsgemaSe Nucleinsauremolekule oder Vek- 
toren im Rahmen von Gentherapie eingesetzt werden, urn Krank- 
heitszustande zu behandeln, die auf eine Dysfunktion des 
entsprechenden Gens zuriickzuf iihren sind, beispielsweise auf 
eine zu geringe oder zu hohe Expression des erf indungsge- 
maSen Proteins in einem Individuum.. Insbesondere konnen die. 
erf indungsgemaSen, Nucleinsauremolekule im Zusammenhang mit 
"gene targeting" und/oder "gene replacement" eingesetzt wer- 
den, urn ein mutiertes Gen wieder in eine funktionelle Form 
zu iiberfuhren oder urn ein mutiertes Gen durch homologe Re- 
kombination zu erzeugen (siehe z.B. Mouellic, Proc . Natl. 
Acad. Sci. USA 87 (1990), 4712-4716; Joyner, Gene Targeting, 
A Practical Approach, Oxford University Press) . Ebenso kann 
ein erf indungsgemaSes Protein oder ein erf indungsgemaSer 
Antikorper eingesetzt werden, urn gegebenenf alls die Menge an 
entsprechendem Protein in einem Individuum zu regulieren. 
Beispiele fur geeignete pharmazeutisch vertragliche Trager 
sind dem Fachmann gelaufig und umfassen beispielsweise phos- 
phatgepuf f erte Salzlosungen, Wasser, Emulsionen, wie z.B. 
6l/Wasser-Emulsionen, sterile Losungen etc. Zusammensetzun- 
gen, die derartige Trager enthalten, konnen nach gangigen 
Verfahren formuliert werden. Die pharmazeutischen Zusammen- 
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setzungen konnen dem betroffenen Individuum in einer ge- 
eigneten Dosis verabreicht werden. Arten der Verabreichung 
sind beispielsweise intravenos, intraperitoneal, subcutan, 
intramuscular, topisch oder intradermal. Die Dosierung hangt 
dabei von vielen Faktoren ab, z.B. von der GroSe , dem Ge- 
schlecht, dem Gewicht, dem Alter des Patienten, sowie der 
Art der speziell verabreichten Verbindung, der Art der Admi- 
nistration etc. Im allgemeinen liegt die taglich verab- 
reichte Dosis bei 1 /xg bis lOtng Einheiten pro Tag. Im Zusam- 
menhang mit der intravenosen Injektion von DNA sind Dosie- 
rungen von 10 bis 10 Kopien des DNA-Molekiils gangig. Die 
Zusammenset zungen konnen lokal oder systemisch verabreicht 
werden. Im allgemeinen wird die Verabreichung parenteral er- 
folgen, z.B. intravenos. DNA kann auch direkt an dem Zielort 
verabreicht werden, z.B. durch biolistische Verabreichung. 

Die vorliegende Erfindung betrifft ferner ein Verfahren zur 
Herstellung eines transgenen nicht -menschlichen Tiers, vor- 
zugsweise einer transgenen Maus, das die Einfiihrung eines 
erf indungsgemaiSen Nucleinsauremolekuls oder Vektors in einer 
Keimzelle embryonale Zelle, eine Eizelle oder eine davon ab- 
geleitete Zelle umf aSt . Das in einera solchen Verfahren als 
Donor der Zellen verwendete nicht -menschliche Tier kann z.B. 
ein gesundes nicht- transgenes Tier sein oder ein Tier, das 
eine Krankheit oder Storung aufweist, insbesonderes eines, 
das eine Wachstumsstorung, vorzugsweise eine die Knochen be- 
treffende Wachstumsstorung aufweist. Eine derartige Krank- 
heit oder Storung kann dabei angeboren oder naturlicherweise 
entstanden sein oder sie kann durch genetische Manipulation 
hervorgeruf en sein, z.B. durch die Einfiihrung und/oder Ex- 
pression einer Fremd-DNA. 

Gegenstand der vorliegenden Erfindung sind ferner transgene 
nicht-menschliche Tiere, die mit einem erf indungsgemaEen 
Nucleinsauremolekul oder Vektor transf ormiert sind oder die 
erhaltlich sind durch das oben beschriebene Verfahren. Vor- 
zugsweise ist in solchen transgenen Tieren das erf indungsge- 
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maSe Nucleinsauremolekiil stabil in das Genom integriert . 
Beispiele fur transgene Tiere sind transgene Ratten, Ham- 
ster, Hunde , Affen, Kaninchen oder Schweine. Bevorzugt sind 
transgene Mause . 

Die vorliegende Erfindung betrifft ebenfalls transgene 
nicht-menschliche Tiere, insbesondere Mause, bei denen die 
Expression des erf indungsgemaSen Proteins verringert ist . 
Eine derartige Verringerung , kann beispielsweise durch 
genetische Veranderung der Zellen der Tiere erreicht werden, 
so daS diese eine antisense-RNA., ein Ribozym oder eine 
Cosuppressions-RNA exprimieren, die zur Reduktion der Ex- 
pression erf indungsgemaSer Proteine in den Zellen f uhrt . 
Alternativ kann eine Verringerung der Expression der erfin- 
dungsgemaSen Proteine auch dadurch erreicht werden, daS 
mindestens eine, vorzugsweise alle Kopien eines einem erf in- 
dungsgemaSen Molekul entsprechenden Gens im Genom der Zellen 
inaktiviert werden. Eine derartige Inaktivierung kann z.B. 
durch die Insertion von Fremd-DNA in codierende oder nicht 
codierende Bereiche des entsprechenden Gens erreicht werden. 
Moglich ist ebenso die Inaktivierung der regulatorischen 
Regionen des Gens. Moglich ist ferner die Deletion von Be- 
reichen des Gens. 

Die vorliegende Erfindung betrifft auch die Moglichkeit, 
erf indungsgemaSe Nucleinsauremolekiile in vivo, d.h. in 
Zellen, Zellkulturen oder Organismen zu aktivieren 
( "Genaktivierung" ) . Dies kann beispielsweise dadurch erfol- 
gen, dafi in das Genom einer Zelle, die ein erf indungsgemaSes 
Nucleinsauremolekiil enthalt, vor das erf indungsgemalSe Nuc- 
leinsauremolekiil ein Promotor insertiert wird, der bei- 
spielsweise konstitutiv ist und eine sehr hohe Expression 
gewahrleistet, oder ein Promotor, der induzierbar ist und 
bei Induktion eine sehr hohe Expression gewahrleistet. 

Das im Rahmen der vorliegenden Erfindung hergestellte 
Plasmid HSL1 wurde bei der als internationale Hinterle- 
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gungsstelle anerkannten Deutschen Sammlung von Mikroorganis - 
men und Zellkulturen (DSMZ) in Braunschweig, Bundesrepublik 
Deutschland entsprechend den Anf orderungen des Budapester 
Vertrages am 25. Marz 1998 unter der Hinterlegungsnummer DSM 
12073 hinterlegt. 

Figur 1 zeigt eine heterozygote LOBO-Maus mit einer Inser- 
tion im LOBO-Gen (oben) im Vergleich zu einer Wild- 
typ-Maus. Die beiden Tiere sind Geschwister und 
sind ca. 6 Wochen alt. 

Figur 2 zeigt die Sequenzierungsstrategie fur die Sequen- 
zierung des murinen und menschlichen LOBO-Gens . Da 
bisher nur das 3 1 -Ende des Gens sequenziert wurde, 
wurden die Exons beginnend votn 3 1 -Ende mit 1,2,3 
etc. durchnumeriert . Es wurden drei murine Wildtyp- 
Cosmid-Clone (Mitte) , zwei Plasmid- Clone aus der 
transgenen LOBO-Maus (oben) und ein humaner Pl-Clon 
(unten) sequenziert. Die Pfeile kennzeichnen die 
bisher bekannten Exons. Sieben Exons befinden sich 
auf der genomischen Sequenz, das achte Exon 
existiert bisher nur auf einem EST-Clon. Die Plas- 
mid-Clone aus der transgenen LOBO-Maus (oben) ent- 
halten das eingefiihrte kiinstliche Gen und die an- 
grenzenden murinen Sequenzen. Diese murinen Sequen- 
zen sind mit den entsprechenden Sequenzen der Wild- 
typ-Maus bis auf 10 Basenpaare identisch, die in 
der transgenen Maus durch das kiinstliche Gen er- 
setzt worden sind. 

Figur 3 zeigt einen Sequenzvergleich zwischen dem LOBO-Pro- 
tein aus Mensch (HS) und Maus (MM) mit verwandten 
Proteinen aus S. cerevisiae (SC-Dis 3), S. pombe 
(Spom l. prot) , C. elegans (CE) und Lactococcus 
(Lactococ) . Aminosaurereste, die bei mehr als der 
Halfte der aufgefiihrten Organismen an der angegebe- 
nen Position vorkommen, sind grau hinterlegt. Es 
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ist jeweils nur der 3 ' -Be 
stellt, da der 5 ' -Bereich 
tococcus, Mensch und Maus 
steht . 



reich der Proteine darge- 
fiir die Proteine aus Lac- 
noch nicht zur Verfugung 



Figur 4 zeigt einen histologischen Dunnschnitt durch Kno- 
chen der Wildtyp-Maus (A, C, E) und der heterozygo- 
ten LOBO-Maus (B, D, F) . 

Die Wandung der Knochen ist bei LOBO-Mausen etwa 3 
mal so dick wie beim Wildtyp (siehe F im Vergleich 
zu E) . Dennoch sind die Knochen der LOBO-Mause brii- 
chiger als die des Wildtyps, da die stabilisieren- 
den Elemente im Knochenmark in Bezug auf Anzahl und 
Grofie signifikant reduziert sind (siehe "blaue In- 
seln" innerhalb des Knochenmarks , A im Vergleich zu 
B) . Das Loch im Knochenmarksgewebe der LOBO-Maus 
(B) ist ein praparationsbedingter Artef akt . 

Die folgenden Beispiele veranschaulichen die Erfindung. 

Beispiel 1 

Auffinden einer Maus mit einem veranderten Knochenwachs turn 

Im Zusammenhang mit der Untersuchung eines bestimmten kilns t- 
lichen Proteins wurde eine transgene Maus erzeugt, die als 
Donor-Maus dienen sollte, d.h. als Spender fur das kiinstli- 
che Protein. Dieses Protein sollte in bestimmten Geweben der 
"Donor" -Maus exprimiert werden, ohne jedoch in dieser Maus 
eine Funktion zu haben. Erst nach der Kreuzung der Donor- 
Maus mit einer geeigneten transgenen Empf anger -Maus sollte 
das Protein wirksam werden und bestimmte Gene der Empfanger- 
Maus aktivieren. 

Die Herstellung der Donor-Maus erfolgte durch Insertionsmu- 
tagenese im Rahmen der Durchfiihrung eines transgenen 
Mausprojektes . Das eigentliche Ziel des Projektes bestand 
darin, transgene Mause zu etablieren, die den Tetrazyclin 
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regulierbaren Transakt ivator (rTA) in lymphoiden Zellen ex- 
primieren. Die fur die Mikroinj ektion in Pronuclei verwen- 
dete Expressionskassette umfaSte die folgenden Elemente in 
5'- 3 ' -Richtung : fxE: Enhancer aus dem Intron der schweren 
Kette der Immunglobulin-Gene der Maus (700 bp) ; einen syn- 
thetischen Promotor, bestehend aus einem Oktamer-Oligo- 
nucleotid und dem Minimal -Promotor des Maus-S-Globin-Gens 
(Wirth et al . , Nature 329 (1987), 174-178) und ein Tet- 
R/VP16 -Konstrukt . Die Enhancer/Promotor-Kombination wurde 
beschrieben in Annweiler et al . (Nucl . Acids. Res. 20 
(1990) , 1503-1509) . Das Tet-R/VP16-Konstrukt ist beschrieben 
in Gossen und Bujard (Proc. Natl. Acad. Sci. USA 89 (1992), 
5547-5551) . Die GesamtgroSe des DNA-Fragments betragt etwa 3 
kb. 

Zur Herstellung der transgenen Mause wurden 1-2 picoliter 
einer DNA-Losung, die die oben beschriebene Expressionscas - 
sette enthielt (Konzentration 1 ng/fj.1) in den mannlichen 
Vorkern einer befruchteten Eizelle einer NMRI-Maus inji- 
ziert. AnschlieSend wurde die Eizelle in den Eileiter einer 
scheinschwangeren weiblichen Ammenmaus transplantiert und 
von dieser zur Geburt ausgetragen. 

Transgene Donor-Mause zeigen normalerweise keinen Phanotyp, 
da das kiinstliche Gen einfach in befruchtete Eizellen ge- 
spritzt wird und sich rein zufallig in irgendeinen Bereich 
des murinen Genoms integriert . 

Da lediglich ca . 5 % des Genoms codierende Bereiche umfas- 
sen, ist die Wahrscheinlichkei t , daE. ein Defekt in einem es- 
sentiellen Gen verursacht wird, entsprechend gering. Dariiber 
hinaus ist das Saugergenom diploid, d.h. alle Gene sind in 
doppelter Ausfiihrung vorhanden . Da einem moglicherweise mu- 
tierten Gen in der Regel eine voll f unktionsf ahige Kopie ge- 
geniibersteht , die den Defekt in der mutierten Version kom- 
pensieren kann, sind die meisten Mutationen rezessiv, d.h. 
sie kommen nicht zur Auspragung, wenn nur eine Kopie des 
Gens betroffen ist. 

Eines der im Rahmen der Herstellung der oben beschriebenen 
Donor-Mause erhaltene Founder-Tier zeigte nun uberraschen- 
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derweise einen extrem auffalligen Phanotyp insfoern, als es 
deutlich grower als die im gleichen Wurf geborenen Geschwi- 
ster war. Auffallig waren der deutlich verlangerte Schwartz 
sowie die verlangerten GliedmaSen, insbesondere die langen 
Zehen. Der GroSenunterschied im Vergleich zu den normalen 
Mausen verstarkte sich noch signifikant iiber die nachfolgen- 
den Wochen, dabei bildete sich eine deutliche Skoliose aus . 
Alle Knochen mit Ausnahme der Schadelknochen sind um das 
1,3- bis 1,5-fache verlangert . Inf olgedessen ist die trans- 
gene Maus insgesamt ca . 1,5 mal langer als eine entspre- 
chende Wildtyp-Maus (siehe Figur 1) . Aufgrund der stark ver- 
langerten Knochen ("long bones" ) wurde die transgene Maus 
als LOBO-Maus bezeichnet. Dieser Phanotyp wird stabil und 
autosomal domintant weitervererbt . Bei Kreuzung einer trans- 
genen Mutante mit einer gesunden Wildtyp-Maus zeigen 50 % 
der Nachkommen den oben beschriebenen Phanotyp. Alle trans - 
genen Nachkommen dieses Founder-Tieres zeigten, unabhangig 
vom Geschlecht, den gleichen Phanotyp. In der Zwischenzeit 
wurden mehr als 200 solcher transgenen Tiere charakteri- 
siert. In alien Fallen korrelierte das Vorhandensein des 
Transgens mit diesem Phanotyp. 

Die weitere histologische Analyse von Knochen transgener 
Mause ergab, daS zum einen eine Osteoporose vorliegt als 
auch eine veranderte innere Knochenstruktur , insbesondere 
eine deutliche Reduktion der trabekularen Strukturen. Das 
verstarkte Knochenwachstum laSt sich bereits sehr friih kurz 
nach der Geburt der Mause anhand der verlangerten Gliedmafien 
und Zehen feststellen, was darauf hinweist, date das ver- 
starkte Knochenwachstum bereits von Anbeginn der Knochenent- 
wicklung im Embryo auf tritt . Histologisch zeigen sich aller- 
dings in der Knochenwachstumszone keine Auf f alligkeiten . 
Die Lebenserwartung der mutanten Tiere ist im Vergleich zu 
ihren Wildtyp-Geschwistern reduziert. Beginnend mit ca . 6 
Wochen nach der Geburt zeigen die LOBO-Mause eine erhohte 
Mortalitat, und nach einem knappen Jahr sind alle Mause aus 
derzeit noch nicht bekannten Grunden gestorben. Homozygote 
Mause sind lebensfahig. Obwohl bislang erst zwei Wiirfe mit 



homozygoten Tieren erhalten wurden, werden die homozygoten 
Tiere der erwarteten Anzahl geboren. Allerdings sind sie 
deutlich weniger gut entwickelt als Windtyp-Tiere und hete- 
rozygote Tiere. Sie zeigen aber ebenso das verstarkte Kno- 
chenwachstum, was an den langeren Fingern eindeutig zu er- 
kennen ist . 

Die Analyse der transgenen Tiere ergab insbesondere , daS ne- 
ben der signif ikanten Verlangerung der Knochen noch drei 
weitere Merkraale fur die transgenen Mause charakterist isch 
sind: 

1. Die Wandung der Knochen ist bei der LOBO-Maus mindestens 
doppelt so dick wie beim Wildtyp. Das Knochenmark der 
normalen Maus enthalt stabilisierende Elemente, die bei 
der transgenen Maus nur in sehr reduzierter Menge vor- 
handen sind, so dafi die Knochen der transgenen Mause 
trotz der verdickten Wandung briichiger sind als die der 
Wildtyp Mause (siehe Figur 4) . 

2. Die Lebenserwartung der LOBO-Mause ist signif ikant ver- 
kiirzt und betragt maximal 40 Wochen. Die durchschnittli- 
che Lebenserwartung liegt bei 25 Wochen, wahrend die 
Wildtyp-Mause 1-2 Jahre alt werden. 

Beispiel 2 

Genetische Analyse der transgenen Maus 

Die molekulare Analyse der Ursache der Mutation ergab, daS 
ca. 1,5 Kopien des Transgens in das Intron eines endogenen 
Gens insertiert wurden. Expressionsstudien (Northern-Analy- 
sen) mit einer cDNA-Probe des endogenen Gens ergab, daS das 
betroffene Gen of f ensichtlich ubiquitar exprimiert wird. 
Wahrend die meisten Organe im Northern nur eine einzelne 
Bande ergeben (ca. 4 kb) findet sich in der Leber noch ein 
zusatzliches kurzeres Transkript (ca. 2kb) . Es ist zur Zeit 
unklar, ob dieses kleinere Transkript a) eine Splice-Vari- 
ante des Gens darstellt , b) auf die Benutzung eines alterna- 
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tiven Promoters zuruckzuf iihren ist oder c) die Kreuzreakt ion 
mit einem verwandten Gen darstelllt. Im Vergleich zu den 
Wildtyp-Tieren, findet man in den heterozygoten Tieren nur 
ca . 50 % der mRNA fur dieses Gen, wenn eine Probe vom 3 ' -Be- 
reich der Insertionsstelle verwendet wird. 



Beispiel 3 



Identif izierung des LOBO-Gens 

Um herauszufinden, welches Gen (oder welche Gene) fur den 
LOBO-Phanotyp verantwortlich sind, wurde der mutierte Be- 
reich aus der transgenen Maus in Bakterien subcloniert . Die 
Lokalisierung des mutierten Bereiches im Genom der Maus und 
die anschlieSende Subclonierung waren moglich, weil die 
Nucleotidsequenz des eingangs erwahnten kunstlichen Gens be- 
kannt war und man diese Information in ent sprechenden mole- 
kularbiologischen Experimenten nutzen konnte . Zur Identif i- 
zierung des Gens, das im folgenden "LOBO-Gen" genannt wird, 
wurden 6 kb aus dem subclonierten Bereich der transgenen 
Maus sowie 87 kb aus der entsprechenden homologen Region der 
Wildtyp-Maus sequenziert. Der gesamte sequenzierte Bereich 
der genomischen DNA- Clone aus Maus ist in Seq ID No . 5 und 6 
dargestellt. Der sequenzierte Bereich umfaSt insgesamt 86902 
Basenpaare. Aus technischen Grunden wurde dieser Bereich m 
zwei Bereiche aufgeteilt, wobei die ersten 49999 Basenpaare 
in Seq ID No . 5 dargestellt sind und ein Exon umfassen und 
die sich an diesen Bereich am 3 ' -Ende anschlieSenden ver- 
bleibenden 36901 Basenpaare in Seq ID No. 6 dargestellt 
sind. Die Exons sind an den folgenden Positionen lokali- 
siert : 

Seq ID No. 5: 8520 - 8753 

Seq ID No. 6: 12487 - 12660 

15497 - 15644 
15908 - 16038 
16148 - 16252 



* 
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17293 - 17394 
18083 - 18556 

Der offene Leserahmen beginnt dabei an Position 8520 in Seq 
ID No. 5. Das Stopcodon befindet sich an der Position 18202 
in Seq ID No. 6. Der codierende Bereich codiert die in Seq 
ID No. 2 dargestellte Aminosauresequenz . Eine detaillierte 
Computeranalyse der Sequenzdaten fuhrte zur Identif izierung 
eines Gens, das aus mindestens 8 codierenden Abschnitten 
("Exons") besteht und mindestens 60.000 Basen lang ist, 
wahrscheinlich aber sehr viel langer. Der bisher identif i- 
zierte, codierende Bereich, der in Seq ID No. 1 dargestellt 
ist, tragt die Information fur 393 Aminosauren. Sequenzver- 
gleiche mit Sequenzen bekannter Proteine ergab, daS zu die- 
sem Protein. ein verwandtes Protein des Spulwurms 
Caenorhabditis elegans existiert, das im vorderen Bereich urn 
etwa 400 Aminosauren langer ist als das Protein der Maus . 
Von daher ist anzunehmen, daS das murine LOBO-Gen noch deut- 
lich langer als 60 kb ist und bisher nur partiell sequen- 
ziert wurde . 

Aufgrund der murinen Sequenzdaten wurde eine DNA-Sonde kon- 
struiert, mit deren Hilfe ein humaner Pl-Clon isoliert 
wurde, der das menschliche LOBO-homologe Gen tragt. Die bis- 
her erhaltene Sequenz des menschlichen genomischen Clons ist 
in Seq ID No . 7 dargestellt. Die Exons sind an den folgenden 
Positionen lokalisiert: 
1 - 136 

3971 - 4118 

4500 - 4630 

4762 - 4866 

5904 - 6005 

6600 - 7109 

Das erste Nucleotid des offenen Leserasters liegt an Posi- 
tion 2. Das Stopcodon befindet sich an der Position 6759. 
Die durch den codierenden Bereich dargestellte Aminosaurese- 
quenz ist in Seq ID No. 4 dargestellt. Ein Clon enthaltend 
die menschliche genomische Sequenz wurde hinterlegt unter 
DSM 12073. Die bisher vorliegenden Sequenzdaten zeigen, date 



auch das humane Gen bisher nur partiell cloniert wurde . Eine 
Ubersicht iiber die erhaltenen und sequenzierten Clone aus 
Maus und Mensch ist schematisch in Figur 2 dargestellt. 

Beispiel 4 

Chromosomal e Lokalisierung des LOBO-Gens 

Einer der erhaltenen Maus-Clone, der einen Teil des murinen 
LOBO-Gens reprasentiert , wurde mit Hilfe von "Fish" 
(fluorescent in situ hybridization) farbmarkiert und auf 
komplette, murine (Metaphase-) Chromosomen hybridisiert . Es 
resultierte ein Farbsignal in der Bande ID auf dem Chromosom 
1 der Maus. Diese Region ist mit der Bande 2q35 auf dem hu- 
manen Chromosom 2 homolog. In diesem Abschnitt befindet sich 
auch ein Gen fur alkaline Phosphatase, dessen Position in 
der Literatur genau bekannt ist. Dieses Phosphatase-Gen be- 
findet sich sowohl bei der murinen Sequenz, als auch bei der 
humanen Sequenz ca . 20 kb hinter dem LOBO-Gen, so daS dessen 
chromosomale Lokalisation in Relation zum Phosphatase-Gen 
sehr genau angegeben werden kann. 

Beispiel 5 

Chrakterisierung der Mutation im LOBO-Gen der transgenen 

Maus 

Die weitere genetische Analyse des LOBO-Gens der transgenen 
Maus zeigte, daS sich die Insertion des kunstlichen Gens in- 
nerhalb des (nicht-codierenden) Introns zwischen den Exonen 
7 und 6 befindet. (Da bisher lediglich das 3 ' -Ende des Gens 
sequenziert ist, wurden die Exons ausgehend vom 3 ' -Ende aus 
fortlaufend mit 1, 2, 3 etc. in Richtung 5 ' -Ende numeriert) . 
Die Insertion ist 48,2 kb von Exon 7 und 5,6 kb von Exon 6 
entfernt und hat zur Deletion von 10 Basenpaaren gefiihrt . 
Letzteres sollte im Intron kein Problem bereiten, da dieser 
Bereich ohnehin nicht codiert . Es ist vielmehr anzunehmen, 
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dalS es aufgrund der kunstlichen DNA- Insertion zur Storung 
bei der Reifung der mRNA kommt . Bei diesem ProzeS werden die 
Introns, die in der primaren RNA noch enthalten sind, her- 
ausgeschnitten ("splicing"). Fur dieses Herausschneiden sor- 
gen gewisse Sequenzsignale . Solche Signale sind auch in dem 
kiinstlich eingefiihrten Gen enthalten, so dafi es vermutlich 
zu einem sogenannten "aberranten splicing" kommt. Infolge- 
dessen wird die Bildung einer f unktionsf ahigen mRNA verhin- 
dert und das entsprechende Protein kann nicht produziert 
werden . 

Tatsachlich hat die experimentelle Uberpriifung der LOBO-Ex- 
pression (durch "Northern Blot") ergeben, daS in heterozygo- 
ten LOBO-Mausen nur noch etwa die Halfte an mRNA produziert 
wird, im Vergleich zur Wildtyp-Maus . In homozygoten LOBO- 
Mausen kann uberhaupt keine LOBO-mRNA mehr nachgewiesen wer- 
den . 

Es ist daher anzunehmen, daS die Mutation in der transgenen 
LOBO-Maus die Genexpression auf post- transkriptionaler Ebene 
abschaltet. Offenbar sinkt dann bereits in den heterozygoten 
Mausen die Menge an produziertem LOBO-Protein unter einen 
kritischen Schwellenwert , was dann zu dem beobachteten , do- 
minant en Phanotyp _ f iihrt . 

Beispiel 6 

Charakterisierung des LOBO-Proteins 

Die aus den einzelnen Exons der sequenzierten Bereiche des 
LOBO-Gens abgeleitete Aminosauresequenz von Maus und Mensch 
wurde mit bekannten Proteinen verglichen. Dabei stellte sich 
heraus, daS das Lobo-Protein keiner der bisher ident if izier- 
ten Proteinklassen zugeordnet werden kann. Die Aminosaurese- 
quenz des Proteins weist jedoch Bereiche auf, die extrem 
konserviert sind sowohl zwischen Mensch und Maus, als auch 
zu Proteinen aus Saccharomyces cerevisiae, Schizosaccharo- 
myces pombe, einem Bakterium der Gattung Leuconostoc und aus 
Caenorhabditis elegans (siehe Figur 3) . Von dem Protein aus 



Hefe (Dis3) ist bekannt , daS es eine Rolle in der Zell 
zykluskontrolle spielt. Die Funktion der anderen Protein 
ist bisher nicht untersucht . 
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SEQUENZPROTOKOLL 





(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER: 

(A) NAME: Andre Rosenthal 

(B) STRASSE: Beutenbergstr . 11 

(C) ORT : Jena 

(E) LAND: Deutschland 

(F) POSTLEITZAHL : 07745 

(ii) BEZEICHNTJNG DER ERPINDUNG : Nucleinsaeuremolekuele codierend 
Proteine, die die Knochenentwicklung beeinf lussen 

(iii) ANZAHL DER SEQUENZEN: 7 

(iv) COMPUTER -LESBARE FAS SUNG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS -DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.30 (EPA) 



(2) ANGABEN ZU SEQ ID NO: 1: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1550 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Doppelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS : cDNA 

(iii) HYPOTHETISCH: NEIN 

(iv) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS: Mus musculus 

(ix) MERKMAL: • 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 2 . . 1180 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 1: 

C CTC GGC CGA AGT AAA GTA GCT GCT GAG AGA GCC ACA AGT GTC TAC 4 6 
Leu Gly A.rg Ser Lys Val Ala Ala Glu Arg Ala Thr Ser Val Tyr 

15 10 15 

TTG GTC CAG AAG GTG GTC CCC ATG CTT CCC AGG CTT CTG TGT GAG GAA 94 

Leu Val Gin Lys Val Val Pro Met Leu Pro Arg Leu Leu Cys Glu Glu 

20 25 30 

CTC TGC AGC CTC AAC CCC ATG ACT GAC AAG CTG ACC TTC TCT GTG ATC 142 

Leu Cys Ser Leu Asn Pro Met Thr Asp Lys Leu Thr Phe Ser Val lie 

35 40 45 

TGG AAG CTG ACC CCT GAA GGC AAG ATC CTT GAA GAG TGG TTT GGC CGC 190 

Trp Lys Leu Thr Pro Glu Gly Lys lie Leu Glu Glu Trp Phe Gly Arg 

50 55 60 
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ACT ATC ATC CGT TCT TGC ACC AAA CTG AGC TAC GAC CAT GCC CAG AGC 
Thr lie lie Arg Ser Cys Thr Lys Leu Ser Tyr Asp His Ala Gin Ser 
65 70 75 



238 



ATG ATC GAA AAT CCA ACT GAG AAG ATC CCT GAG GAA GAG CTT CCC CCA 
Met lie Glu Asn Pro Thr Glu Lys lie Pro Glu Glu Glu Leu Pro Pro 
80 85 90 95 
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ATT TCT 
lie Ser 



CCA GAG 
Pro Glu 



CAC AGC 
His Ser 
100 



GTC GAG 
Val Glu 



GAG 
Glu 



GTG 
Val 
105 



CAC CAG GCA GTC 
His Gin Ala Val 



CTG AAC 
Leu Asn 
110 



334 



CTG CAC 
Leu His 



AGC ATT 
Ser lie 
115 



GCA AAG 
Ala Lys 



CAA CTC 
Gin Leu 



CGC 
Arg 
120 



CGC 
Arg 



CAG 
Gin 



CGC TTT GTA 
Arg Phe Val 
125 



GAT GGC 
Asp Gly 



382 



GCA CTC 
Ala Leu 



CGT TTA 
Arg Leu 
130 



GAT CAG 
Asp Gin 



GAG TTC 
Glu Phe 
135 



ATG 
Met 



CTC 
Leu 



CTG 
Leu 



GCC AAC ATG 
Ala Asn Met 
140 



GCG GTG 
Ala Val 



430 



GCC CAC 
Ala His 
145 



AAG ATC 
Lys lie 



TTC CGC 
Phe Arg 



ACC TTC 
Thr Phe 
150 



CCT GAG 
Pro Glu 



CAG 
Gin 



GCC CTG CTG 
Ala Leu Leu 
155 



CGC CGG 
Arg Arg 



478 



CAT CCC 
His Pro 
160 



CCA CCA 
Pro Pro 



CAG ACG 
Gin Thr 
165 



AAG ATG 
Lys Met 



CTC AGT 
Leu Ser 



GAC 
Asp 
170 



CTG GTG GAG 
Leu Val Glu 



TTC TGT 
Phe Cys 
175 



526 



GAC CAG 
Asp Gin 



ATG GGG 
Met Gly 



CTG CCC 
Leu Pro 
180 



ATG GAT 
Met Asp 



GTC AGC 
Val Ser 
185 



TCT 
Ser 



GCA GGG GCC 
Ala Gly Ala 



CTA AAT 
Leu Asn 
190 



574 



ATG GCA 
Met Ala 



CTG TAC 
Leu Tyr 
195 



TTC TGC 
Phe Cys 



TCT GGG 
Ser Gly 



ATG CTG 
Met Leu 
200 



CAG GAC 
Gin Asp 



CAG GAG 
Gin Glu 
205 



CAG TTC 
Gin Phe 



622 



CGG CAT 
Arg His 



TAT GCT 
Tyr Ala 
210 



CTC AAC 
Leu Asn 



GTT 
Val 



CCC 
Pro 
215 



CTC TAC 
Leu Tyr 



ACA CAC 
Thr His 



TTC ACC 
Phe Thr 
220 



TCT CCC 
Ser Pro 



670 



ATC CGC 
lie Arg 
225 



CGC TTT 
Arg Phe 



GCT GAC 
Ala Asp 



GTC 
Val 
230 



ATA 
lie 



GTG CAC 
Val His 



CGC CTC 
Arg Leu 
235 



CTG GCT 
Leu Ala 



GCT GCT 
Ala Ala 



718 



CTG GGC 
Leu Gly 
240 



TAC AGT 
Tyr Ser 



GAA CAG 
Glu Gin 
245 



CCA 
Pro 



GAT 
Asp 



GTG GAG 
Val Glu 



CCT GAT 
Pro Asp 
250 



ACC CTA 
Thr Leu 



CAG AAG 
Gin Lys 
255 



766 



CAA GCT 
Gin Ala 



GAC CAC 
Asp His 



TGC AAT 
Cys Asn 
260 



GAC CGT 
Asp Arg 



CGC ATG 
Arg Met 
265 



GCT TCC 
Ala Ser 



AAA CGT 
Lys Arg 



GTG CAG 
Val Gin 
270 



814 



GAG CTC 
Glu Leu 



AGC ATC 
Ser lie 
275 



GGC CTC 
Gly Leu 



TTC TTC 
Phe Phe 



GCA GTT 
Ala Val 
280 



CTA GTA AAG GAG 
Leu Val Lys Glu 
285 



AGT GGC 
Ser Gly 



862 



CCC CTG 
Pro Leu 



GAG TCC 
Glu Ser 
290 



GAA GCC 
Glu Ala 



ATG GTG 
Met Val 
295 



ATG GGT 
Met Gly 



GTC CTG AAC CAA 
Val Leu Asn Gin 
300 



GCT TTC 
Ala Phe 



910 



GAC GTG CTG GTG CTG CGC TTT GGG GTG CAG AAG CGC ATC TAC TGC AAT 
Asp Val Leu Val Leu Arg Phe Gly Val Gin Lys Arg lie Tyr Cys Asn 
305 ' 310 315 
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GCA CTG GCC CTG CGA TCC TAC AGC TTC CAG AAG GTG GGG AAG AAG CCA 1006 



Ala Leu Ala Leu Arg Ser Tyr Ser Phe Gin Lys Val Glyl LyW.Lys* *Pro*«» 

320 325 330 335 

GAG CTC ACT CTT GTT TGG GAG CCT GAT GAC CTT GAA GAG GAG CCA ACA 
Glu Leu Thr Leu Val Trp Glu Pro Asp Asp Leu Glu Glu Glu Pro Thr 
340 345 350 

CAG CAG GTC ATC ACC ATC TTC AGC CTG GTG GAT GTG GTC CTG CAG GCA 
Gin Gin Val lie Thr lie Phe Ser Leu Val Asp Val Val Leu Gin Ala 
355 360 365 

GAG GCC ACA GCC CTC AAG TAC AGT GCT ATC CTG AAG CGA CCA GGC CTG 
Glu Ala Thr Ala Leu Lys Tyr Ser Ala lie Leu Lys Arg Pro Gly Leu 
370 375 380 

GAG AAG GCG TCT GAT GAG GAG CCT GAG GAC TGAATGCTAG CCCAAGCCAG 
Glu Lys Ala Ser Asp Glu Glu Pro Glu Asp 
385 390 

GCCTGTGCCT GCCCTACCCT GCTGGCTTTT AGGAATAGGA CCTTTTGACA CCAAAGGGGA 

TTTTTAATTT GGTTTTTAAC AACTCAGGGG TTTGTTTTTA TTTTTATTTT TCCTTTTATT 

TTACTTTTGC AGCTCAGTTT TTAAATGAAC TGGAAGGTTA GGGGTCAGGG CAGGGGATGC 

TGAGGCCTGG CCTGTGCTTC CCT GAG CAG A GAGGATCCCA GTCCTCCTGG GCAGGCAGCC 

CCGCTTCTAC CAGGCGACCC ACTGCCCTTC CCTGCCCAGG AAATGGGGGG TTTCAGCAAA 

TCAGTGTCAT GGAATAAAAT CAAGTGTGAA TTGCAAAAAA AAAAAAAAAA 

(2) ANGABEN ZU SEQ ID NO: 2: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 393 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Leu Gly Arg Ser Lys Val Ala Ala Glu Arg Ala Thr Ser Val Tyr Leu 
15 10 15 

Val Gin Lys Val Val Pro Met Leu Pro Arg Leu Leu Cys Glu Glu Leu 
20 25 30 

Cys Ser Leu Asn Pro Met Thr Asp Lys Leu Thr Phe Ser Val He Trp 
35 40 45 

Lys Leu Thr Pro Glu Gly Lys He Leu Glu Glu Trp Phe Gly Arg Thr 
50 55 60 

He He Arg Ser Cys Thr Lys Leu Ser Tyr Asp His Ala Gin Ser Met 
65 70 75 80 

He Glu Asn Pro Thr Glu Lys He Pro Glu Glu Glu Leu Pro Pro He 
85 90 95 

Ser Pro Glu His Ser Val Glu Glu Val His Gin Ala Val Leu Asn Leu 
100 105 HO 

His Ser He Ala Lys Gin Leu Arg Arg Gin Arg Phe Val Asp Gly Ala 
115 120 125 
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L=-u Am Leu Asp Gin Glu Phe Met Leu Leu Ala Asn M§t %la'yJl'Ma- 

~ ill ^ 135 140 

His Lvs Tie Phe Arg Thr Phe Pro Glu Gin Ala Leu Leu Arg Arg His 
145 " 150 155 160 

Pro Pro Pro Gin Thr Lys Met Leu Ser Asp Leu Val Glu Phe Cys Asp 

165 no 175 

Gin Met Gly Leu Pro Met Asp Val Ser Ser Ala Gly Ala Leu Asn Met 
180 185 190 

Ala Leu Tyr Phe Cys Ser Gly Met Leu Gin Asp Gin Glu Gin Phe Arg 
195 200 205 

His Tyr Ala Leu Asn Val Pro Leu Tyr Thr His Phe Thr Ser Pro He 
210 215 220 

Ara Arq Phe Ala Asp Val He Val His Arg Leu Leu Ala Ala Ala Leu 
225 230 235 240 

Glv Tvr Ser Glu Gin Pro Asp Val Glu Pro Asp Thr Leu Gin Lys Gin 
y 245 250 255 

Ala Asp His Cys Asn Asp Arg Arg Met Ala Ser Lys Arg Val Gin Glu 
260 265 270 

Leu Ser lie Gly Leu Phe Phe Ala Val Leu Val Lys Glu Ser Gly Pro 
275 280 285 

Leu Glu Ser Glu Ala Met Val Met Gly Val Leu Asn Gin Ala Phe Asp 
290 295 300 

Val Leu Val Leu Arg Phe Gly Val Gin Lys Arg He Tyr Cys Asn Ala 
305 310 315 320 

Leu Ala Leu Arg Ser Tyr Ser Phe Gin Lys Val Gly Lys Lys Pro Glu 
325 330 335 

Leu Thr Leu Val Trp Glu -Pro Asp Asp Leu Glu Glu Glu Pro Thr Gin 
340 345 350 

Gin Val He Thr He Phe Ser Leu Val Asp Val Val Leu Gin Ala Glu 
355 360 365 

Ala Thr Ala Leu Lys Tyr Ser Ala He Leu Lys Arg Pro Gly Leu Glu 
370 375 380 

Lys Ala Ser Asp Glu Glu Pro Glu Asp 
385 390 



(2) ANGABEN ZU SEQ ID NO : 3: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 1140 Basenpaare 

(B) ART : Nucleotid 

(C) STRANGFORM: Doppelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : cDNA 



(iii) HYPOTHETISCH : NEIN 



(iv) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS: Homo sapiens 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 
<B) LAGE : 2 . . 782 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

G ATC CAC CGC GCC TTC CCC GAG CAG GCC CTG CTG CGC CGG CAC CCC 
lie His Arg Ala Phe Pro Glu Gin Ala Leu Leu Arg Arg His Pro 
365 370 375 

CCG CCC CAA ACA AGG ATG CTC AGT GAC CTG GTG GAA TTC TGC GAC CAG 
Pro Pro Gin Thr Arg Met Leu Ser Asp Leu Val Glu Phe Cys Asp Gin 
380 385 390 

ATG GGG CTG CCC GTG GAC TTC AGC TCC GCA GGA GCC CTC AAT ATG GCA 
Met Gly Leu Pro Val Asp Phe Ser Ser Ala Gly Ala Leu Asn Met Ala 
395 400 405 

CTG TAC TTC TGC TCG GGG CTG CTG CAG GAC CCA GCG CAG TTC CGG CAC 
Leu Tyr Phe Cys Ser Gly Leu Leu Gin Asp Pro Ala Gin Phe Arg His 
410 415 420 

TAC GCG CTC AAT GTG CCC CTG TAC ACA CAC TTC ACC TCG CCC ATC CGC 
Tyr Ala Leu Asn Val Pro Leu Tyr Thr His Phe Thr Ser Pro lie Arg 
425 430 435 

CGC TTT GCC GAC GTC CTG GTG CAC CGC CTC CTG GCT GCC GCG TTA GGC 
Arg Phe Ala Asp Val Leu Val His Arg Leu Leu Ala Ala Ala Leu Gly 
440 445 450 455 

TAT AGG GAG CGA CTA GAC ATG GCG CCC GAT ACC CTG CAG AAA CAG GCG 
Tyr Arg Glu Arg Leu Asp Met Ala Pro Asp Thr Leu Gin Lys Gin Ala 
460 465 470 

GAC CAC TGT AAC GAC CGC CGC ATG GCG TCC AAG CGC GTG CAG GAG CTC 
Asp His Cys Asn Asp Arg Arg Met Ala Ser Lys Arg Val Gin Glu Leu 
475 480 485 

AGT ACC AGT CTC TTC TTT GCT GTT CTG GTC AAG GAG AGT GGC CCC CTG 
Ser Thr Ser Leu Phe Phe Ala Val Leu Val Lys Glu Ser Gly Pro Leu 
490 495 500 

GAG TCA GAA GCC ATG GTG ATG GGC ATC CTG AAG CAA GCC TTC GAC GTG 
Glu Ser Glu Ala Met Val Met Gly lie Leu Lys Gin Ala Phe Asp Val 
505 510 515 

CTG GTG CTG CGC TAC GGC GTG CAG AAG CGC ATC TAC TGC AAC GCA CTG 
Leu Val Leu Arg Tyr Gly Val Gin Lys Arg lie Tyr Cys Asn Ala Leu 
520 525 530 535 



GCC CTG CGG TCC CAC CAC TTC CAG AAG GTG GGC AAG AAG CCG GAA CTC 
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Ala Leu Arg Ser His His Phe Gin Lys Val Gly Lys Lys ^ro'.qiu'^eu * 

540 545 550 

ACG CTG GTC TGG GAG CCT GAG GAC ATG GAG CAG GAG CCA GCA CAG CAG 
Thr Leu Val Trp Glu Pro Glu Asp Met Glu Gin Glu Pro Ala Gin Gin 
555 560 565 

GTC ATC ACC ATC TTC AGC CTG GTG GAG GTG GTC CTG CAG GCA GAG TCC 
Val lie Thr lie Phe Ser Leu Val Glu Val Val Leu Gin Ala Glu Ser 
570 575 580 

ACA GCC CTC AAG TAC AGC GCC ATC CTG AAG CGG CCA GGC ACC CAG GGC 
Thr Ala Leu Lys Tyr Ser Ala lie Leu Lys Arg Pro Gly Thr Gin Gly 
585 590 595 

CAC CTG GGC CCT GAG AAG GAG GAG GAG GAG TCT GAC GGT GAG CCC GAG 
His Leu Gly Pro Glu Lys Glu Glu Glu Glu Ser Asp Gly Glu Pro Glu 
600 605 610 615 

GAC TCA AGC ACC AGC T GAGCTCCACC AGCCGCCTGC CCCGCCTGCC 
Asp Ser Ser Thr Ser 
620 

CCGCCTGCCT GTCCCGCCAC ACTGGCTTTA GGACCTGTTG ACACGGAGGG GGGTTTTTAA 
TTTGGTTTTT AACAACTCAG GGGTTTGTTT TTATTTTTAT TTAATTTTTG CAGCTCAACT 
TTTAAACAAA CTGCAGGGGA GAGGGTGGGG CTGGAAGGAA GGCTGAGGCC TGGTCAGCAG 
TGACCCCAGC AGAGCAGGCC CCAGTCCTCC TGGGAGGCTG GCCCCCCTTT TTTCTGGGCC 
CTACTGCCCT CCTCTGCCCA GGAAATGGGG GGGTTTCAGC AACTCAGTGT CACAGAATAA 
AATCAAGTGT GGAGTGCCAT AAAAAAAA 



(2) ANGABEN ZU SEQ ID NO : 4: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 260 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 4: 

lie His Arg Ala Phe Pro Glu Gin Ala Leu Leu Arg Arg His Pro Pro 
15 10 15 

Pro Gin Thr Arg Met Leu Ser Asp Leu Val Glu Phe Cys Asp Gin Met 
20 25 30 

Gly Leu Pro Val Asp Phe Ser Ser Ala Gly Ala Leu Asn Met Ala Leu 
35 40 45 




Tyr Phe Cys Ser Gly Leu Leu Gin Asp Pro Ala Gin Phe Arg His Tyr 
50 55 60 



Ala Leu Asn Val 
65 

Phe Ala Asp Val 



Arg Glu Arg Leu 
100 

His Cys Asn Asp 
115 

Thr Ser Leu Phe 
130 

Ser Glu Ala Met 
145 

Val Leu Arg Tyr 



Leu Arg Ser His 
180 

Leu Val Trp Glu 
195 

lie Thr lie Phe 
210 

Ala Leu Lys Tyr 
225 

Leu Gly Pro Glu 



Ser Ser Thr Ser 
260 



Pro Leu Tyr Thr 
70 

Leu Val His Arg 
85 

Asp Met Ala Pro 



Arg Arg Met Ala 
120 

Phe Ala Val Leu 
135 

Val Met Gly lie 
150 

Gly Val Gin Lys 
165 

His Phe Gin Lys 



Pro Glu Asp Met 
200 

Ser Leu Val Glu 
215 

Ser Ala lie Leu 
230 

Lys Glu Glu Glu 
245 



His Phe Thr Ser 
75 

Leu Leu Ala Ala 
90 

Asp Thr Leu Gin 
105 

Ser Lys Arg Val 



Val Lys Glu Ser 
140 

Leu Lys Gin Ala 
155 

Arg lie Tyr Cys 
170 

Val Gly Lys Lys 
185 

Glu Gin Glu Pro 



Val Val Leu Gin 
220 

Lys Arg Pro Gly 
235 

Glu Ser Asp Gly 
250 



f>r o • 1 1 e* • Arg" • Ar g 
80 

Ala Leu Gly Tyr 
95 

Lys Gin Ala Asp 
110 

Gin Glu Leu Ser 
125 

Gly Pro Leu Glu 



Phe Asp Val Leu 
160 

Asn Ala Leu Ala 
175 

Pro Glu Leu Thr 
190 

Ala Gin Gin Val 
205 

Ala Glu Ser Thr 



Thr Gin Gly His 
240 

Glu Pro Glu Asp 
255 



(2) ANGABEN ZU SEQID NO: 5: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 49999 Basenpaare 

(B) ART : Nucleotid 

(C) STRANGFORM : Doppelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Genom-DNA 



(iii) HYPOTHETISCH : NEIN 
(iv) ANTISENSE : NEIN 



(vi) 



URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS: Mus musculus 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5 

GATCAAGTCC AGAACCTCAC ACTGAAACCC AAGCCTTGTG ATGTTCTTAG TGGTGACATT 60 

CTTATTCACG TAGTAAATAT TGAATGGTAT TTGTTG CACT CAGATACCAT ACAAGGTATT 12 0 

GAAAATCTCA GACATTTCCC CATCCAGACA GAAGTCCATC TTTCCTAGTT GTAGTTGTCT 18 0 

ATTCTCCCTT TCCCCTGGCT GCATGTTTTA AATTTCTTAC AGTAAAGGCA TATTGCAACT 24 0 

TAAAAGCAAA AGTCATTTTG AGACATTTTC GCCTGTTTTT TAATAAGTAG ATGAGATATT 3 00 

GGAGTGCATT TGTAGGCTGA GTGAAAGACA GACAAAGTGA GGAAGGAGTC ACAGTTTGGG 3 60 

AGCCTGGTAA AGAAGGACTC AGCCTATGAG AGCAATGAGT TCCCACAGGA CAAGGGTCAG 420 

CTCTTCTCCT ACCTTGACTA GAATAAAGGG AGGGGCTGGG AATGGGGCTC AGTAGACCAT 4 80 

GGGAAGGTGA TTCGATGCTC CCTGTCAGGT TCCCCAGGGG TAAATGTCAT TTTCCCTGCA 54 0 

^^^^ CTCCAGGGCC AGTTCTGTTC CATTCTGTTC TCCTGCCAGA CTCTTTTTTT TTTTTTTACA 600 

GTTTTTTTTA ATTAGGTATT TTCTTCATTT ACATTTCAAA TGCTATCCCA AAAGACCCCC 660 

CATACCCTCC CCCCCATTCC CCTACCCACC CACTCCCACT TCTTGGCCCT GGTGTTCCCT 72 0 

TGTACTGGGG CATATAAAGT TTGCAAGACC TATGGGCCTC TCTTCCCAAT GATGGCCGAC 780 

TAGGTCATCT TCTGAAACAT ATGCAGCTAG AGACACGAGC TCTGGAGGTA CTGGTTAGTT 84 0 

CATATTGTTG TTCCACCTAT AGGGTTGCAG ACACCTTTAG CTCCTTGAGT ACTTCCTCTA 90 0 

GCTCCTCCAT TGGGGGCCCT GTGTTCCATC CAATAGCTGA CTATGAGCAT CCACTTCTGT 960 

GTTTGCCAGG CATCGCATAG CCTCACAAGA GACAGCTGTA TCAGGGTCCT TTCAGCAAAA 102 0 

TCTTGCTGGT GTATGCAATG GTGTCAGCAT TTGGAGGCTG ATTATGGGAT GGATCCCCGG 10 8 0 

•GTATTCCTGC CAGACTCTTA AGCCCGGACC AGAGTTTTAC GTCTTCCTCA TAGTTCAGTG 114 0 

CCCTCTACCC AGAAAACACT TTGCCTTGGT TTTCACTGTT CTGTTTATTC CTGTTGCTTA 12 0 0 

GTGAGATGGT GGGCCCCAAA TAAGCATGTG CATCCCCAGC AGCCACCCCA ATCCTATGAA 12 60 

CTTGCATGCT GGGAGTTGTG GAGTGTCTCA GGTAGCCCTG CCATGCTTCC CCACAGAGCT 132 0 

GCTCTTCATT TCCTTAATGA CCCCTGTGGA CTTTCATACC ATTAACCTGC CAGATGCCAC 13 8 0 

CACTGAAAAG CTTGTATTCT TCCTGGGCTA CTGTGGTCCA AAGCAAGACT CCCACAGTGC 144 0 

CATGTAGCTT AAGGCTTTCG CTAAAAG C AG TGCTAGGTGC TGTGTTTCAT ACCTAGGCAC 15 0 0 

CCTACTAAAT ACCTGAGAAA CTCCAGGAGG AAGTAG CTTC AAAGCCTAGT TCTGAGAATC 15 60 

AGAAATTGTT CCCATAATCT CTCCTCTTAG TCACTACAAG GGGCAGAGCC TAGCTGTTTT 162 0 

ATTTCAGGAC TGTCGGTGGG ACCTCTGTAG CAAGGGAGGG ATGGAAGGAG CTGCTGTTCC 16 8 0 




ATATCCCTCA AGTCCCAGTT TTCCACTGAA 
GTCACATCAG AGGAGCAACG GAACTCAGTT 
AG AAT C C AAA ATGAAACATT TTCAAGATAT 
GAAAAGGTTA TGGTGTGGAG TGTCTTTTCA 
ATGGACCTGT TCAAAGGAAG GCTGGGGTAC 
GTTTCCTGGA TCCAGAATTC CCCCACCCCC 
TCTTTCTCCC TCCCCTCCTC CAGTTTCCTT 
GCCTTTAATG GGGGACTTTT GGGATAGCAC 
AAAAATATTT AAAAAAAAAA GATGCCTCCT 
AGATTATACC TGCTTGAGTA CCTTTACCCA 

•GCCACAGCTA GAGTTTCGGC TCCCTCTAGC 
ACCCTTTGAT ACAGTTCCTC ATGTTGAGGT 
ACTTCATAAC TATAACTTTG GTGCTGTTAT 
ATGTCTGATA T AAT C C C AAA GGGGTTGCAA 
CTGTATGTGG CAAAGATTTG GTTTCCTCTG 
AGCTGTCATC AGATCAGGAT GGGAAAGGAC 
AGTGAGTGAT AAGATTGTAT AGTTAATTCC 
GCACAAACTG ACTTAGAACC CAAACAGGCT 
CTGGGCTTCT AAGGCACTGG TCCTTTCCCA 
AGCCTGTGAG ATGAAAGGAG CTGCTGCTGG 
A GCCCTGCTGT CTTTCTCTTG TTGTCAGTCT 
AGGGCCTAAT GAAGGAGGAC CCCCAACCCT 
TTTCTGACTA GTTAGTCACA GG T C ATT CCA 
CCTCCTGCCC TTTGCTGTCC CCGCCTCTCC 
GTTCTTGACA CCTTTTACTG TCCTTTTGGC 
GTTGGCTGGG ATAGCCATGT TGACCAGACT 
AGCAATCTGC TGCCCCCAGG CACCACCACC 
GGAAAGTGCT TCTTTCTGCC TTCCAGGCTT 
CAGAGGTTCA GAACTCATTT CACATCTAGT 
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GACACCAGCC AGCT^GA^GC? •CTTCCCTAA&* "llHO **' • 

GTGAAGCAGT GAAGCTTGAG GATGAAAAGC 1800 

GAAATGAGGT GTTTGTTTCA GTAAGCAGCA 18 60 

AGGACAAGGG GCTTTATGAG CTGGCTTACA 192 0 

TAGGTTCACC AGGCAGAAGG TATCTGTGAT 198 0 

CACCCCCACT GCTACTTCCC ACATTCTCCT 2 040 

TCTGTACAGA GAGATGAGTC CCAAACATGA 210 0 

TGGAAATGTA AACGAGGAAA ATACCTAATA 216 0 

GCCAGTCTTG AGGACAGTGG AACACTTTGA 22 20 

CTGTTACGGG AACACAATTC CTATCTCCTG 22 80 

CCAATGGTTC TCAGCCTTCC TGATGCTGCA 234 0 

GACCCCCAAC CATAAAATTA TTTCATAGCT 24 00 

AAACCCTAAT GTTAGCAACC AACATACAGG 24 6 0 

CCCACAGATT GAAAACCCCT GATCTAGATG 252 0 

CTTCCTTGTC TTTGGTTTAG AAGCTTACAT 25 8 0 

CTAATCTCTC TTGAGACTGA AGGACAAGCC 2 64 0 

AGCTTCTTCT CTATGCAGAC TCTACCATGT 2 70 0 

GGCTAACTTG GAACCAGCCA ACCTGTGTTG 276 0 

GCCACTGGTG GTCTTGACAC AG C AAG AG C A 2 82 0 

TGGGAGGCAG CCTTGCCACA GTTTCATTCT 2 88 0 

CATTCTGTCA CCTCAGGCCT CAGTTGAGAG 2 94 0 

GCCCCCTGCT TATATGAAGC CACCCCATAG 3 00 0 

TAAGGAATCA GCTTTCCTTC CATCAAGCAA 3 06 0 

ACCTCTGCCC AAGTCATTTT CAGACACTTT 312 0 

CAGGATGGCT GGGATGGCCA GGACGGCCAT 318 0 

AGCCTTGCCT TCATAGCTTT AAGAAGCAGC 3 24 0 

ACTCCAGACA GCCTGCTTTT GTTCCAGTCA 330 0 

TTTGAACTAA AAGTTCTGTA TGAGGAAGCC 33 60 

TATTTAAAAT TTAAAATTAG CTCTATTAGT 3 42 0 
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AGTTTTTTGA ACCAAATATG TCTCAATGAG TTAATATTTT T C AG A.J; AA'f A f^lAAAJ?..* '^4*8 0 

AGTTCATGGA ATAGGACGGA GGTCCAAAGG TTTCTTCACG CCTTTATATC TATAAATTGT 3 54 0 

AGAAATGAGG TATAATTGTA GAAATATATT TGAGGTATAT TTTGATTCTC ATCATCTACG 3 600 

TTACGACCTT CCGCTAAAAA GAAAAAAGTG TGTGTGTGTG TGTGTGTGTG TGTGTGTGTG 3 660 

TGTGTGTGTG TGTGCGCGCA CACACACATC CACATGAATC CACTATATAT ATATATATTT 3 72 0 

TTTTTACTCT GAACCTTCAG GTATGGACCT AAGAGTTTGC ATGATTCTTG AGTATTTCCC 3 7 80 

ACCTGATTGC CCAGCTTCCC CTGGTGTGTC AAAGTGATGC TCAAAGGCTG TGTACCTGAG 3 840 

GCTGGGACCA GCAGCACTGA GTAGGTCAGG AGGGGATACC T C C TT AG ATA ATGGGTTTCT 3 90 0 

CAGCCATGTG TCTTCAGTCT GTGGAGAGAC TGTG CTTAAG CTGACATTCT GAACAGTGGC 3 960 

ACCCCACAGT ATGTGCTAGA ATCCTGTGTA GAGTTCAGTG TGGCCTGAAT CCTGTGGTTA 4 02 0 

^^^^TGCAAAGGAG GCAGGACACG ATCTCCTCAG GGGTACTGTC CATGTGTTCC CTCCTCCTTT 4 0 80 

TTTTTTTCTA CCTTTTCCAT GAAAAGCCCT TTGTCTTCTG CCACTGGCTC TGGTTATGGA 414 0 

CTTGGTGTTG ATGTGAGTAC AGTTTTCAGA TTGGAAATTA ATGAGGTGTT CCATTGAGAG 42 00 

AAG CCTGACT TCTACCCTGG CTGGCTGCTC CCAGGTTTCC TCCATGTGGG TCTTTGCTGC 4 2 60 

TTTCTCTGTG GGCAGCTGCC CTTGGCTGGC ATTCTTCTAT TGGCTTTCCC CAGAGGTACT 43 20 

TTCAAGACTG CTTTCCCAGG CTAGAAACTA TTCTAGTACA TGTCAGCTGT GCCTCCCACA 43 80 

AGTCCCAAGC CATGGTAAAG CCAGACAGCC TTGG CTGAG A AGGGAAGTTC GAAAAGGCTC 44 4 0 

TCCTTTGTAT GTTTGTGAAG AAGGGATGAA GGGCAAAAGA GGAAGGGAAA TCAGGTAAAG 4 500 

ATGCTATGGA AACCAGCACC TAAAGTAGAA AGTTTGGTAG TGTCCATGTG GGCATTGGAG 4560 

, _ AAAGGCTGTC TTGACAAGAA GGAAACAAAG AAGCAGAGGT ACCTATTAGG TAGAACAGGT 4 62 0 

GCTTCTAATA AGATAGTGTA CTATTAGTAG GCATGTAGCC AGGCTCTGGT GAGGAATAGT 4 680 

AGGCAACATA GGGTGACACA TGGCTGCTAG TCAGGGCTCA ACAATCAGAG GGGACTAAGG 4 74 0 

AAG C AACTG A TGTGTAGAGC CAAGACATGT GGGCATGTAG G C AG AAG AAC ATCTAAGAGC 4 800 

TTTGTACAGC TTACTGTAAA GGTTTGTGCA TAAAACTTAG AATGCTCTGA GCACTCATCA 4 860 

GATTCTACAG CTGTTCTTGC TCCAACTTTG TACAGCAGAA ATCTGCTAAT TGTGTAGTAG 4 92 0 

TTACCTTCAC TTGAGTGTCA TGTACTAGGA AGGAGGATGC AGGCCACAGG AGGACAGATA 4 980 

TCAAGACCTG AGTGTGGGGA GGAGTTCATG AGCTAGCTCA CTGGGAGGTG TAG G AATG AA 5 04 0 

AAGGGTGGCA CACAATGTAA GCTGCCACCA TCTGTCAGCA GGCTGAAAAC AGACTGCCTA S100 

ACACACATGT ACACAGGACT GAGCTGAGGG AGAACTCATT TGGGAAGAAA ATTAAGAAAA 516 0 
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GAAAGAAGCA TAGTGTCCAC ACTTCAGTCT TCATTTTTCT TGAGrTTCAT*«STG*'5'i'TAGGA.«" **»5 220 

AATTGTATCT TATATCTTGG GTATCCTAGG TTTTGGGCTA ATATCCACTT ATCAGTGAGT 5 2 80 

ACATATTGTG TGAGTTCCTT TGTGAATGTG TTACCTCACT CAGGATGATG CCCTCCAGGT 5 34 0 

CCATCCATTT GGCTAGGAAT TTCATAAATT CATTCTTTTT AATAGCTGAG TAGTACTCCA 54 0 0 

TTGTGTAGAT GTACCACATT TTCTGTATCC ATTCCTCTGT TGAGGGGCAT CTGGGTTCTT S460 

TCCAGCTTCT GG C T ATT AT A AATAAGGCTG CTATGAACAT AGTGGAGCAT GTGTCCTTCT 5 52 0 

TACCAGTTGG GGCATCTTCT G GAT AT AT G C CCAGGAGAGG TATTGCTGGA TCCTCCGGTA 558 0 

GTACTATGT C CAATTTTCTG AGGAACCGCC AGACGGATTT CCAGAGTGGT TGTACAAGCC 5 64 0 

TGCAATCCCA CCAACAATGG AGGAGTGTTC CTATTTCTCC ACATCCACGC CAGCATCTGC 57 0 0 

TGTCACCTGA ATTTTTGATC TTAGACATTC TGACTAGTGT GAGGTGGAAT CTCAGGGTTG 57 6 0 

TTTTGATTTG CATTT CCCTG ATGATTAAGG ATGTTGAACA TTTTTTCAGG TGCTTCTCTG 582 0 

CCATTCGGTA TTCCTCAGGT GAGAATTCTT TGTTCAGTTC TGAGCCCCAT TTTTTAATGG 58 8 0 

GGTTATTTGA TTTTCTGAAG TCCACCTTCT TGAGTTCTTT ATATATGTTG GATATTAGTC 5 94 0 

CTCTATCTAA TTTAGGATAG GTAAAGATCC TTTCCCAATC TGTTGGTGGT CTCTTTGTCT 60 0 0 

TATTGACGGT GTCTTTTGCC TTGCAGAAAC TTTGGAGTTT CATTAGGTCC CATTTGTCAA 60 6 0 

TTCTCGATCT TACAGCACAA GCCATTGCTG TTCTGTTCAG GAATTTTTCC CCTGTGCCCA 612 0 

TATCTTCAAG GCTTTTCCCC ACTTTCTCCT CTATAAGTTT CAGTGTCTCT GGTTTTATGT 618 0 

GAAGTTCTTT GATCCATTTA GATTTGACCT AGTGTGGACA CTATGCCCCT CCTTAGAAGT 624 0 

GGGAACAAAA CACCCTTGGA AGGAGTTACA GAGACAAAGT TTGGAGCTGA GATGAAAGGA 63 0 0 

TGGACCATGT AGAGACTGCC TTATCCAGGG ATCCACCCCA TAATC AG CAT CCAAACGCTG 63 6 0 

ACACCATTGC ATACGCTAGC AAGATTTTAT CGAAAGGACC CAGATGTAGC TGTCTCTTGT 64 2 0 

GAGACTATGC CGGGGCCTAG CAAACACAGA AGTGGATGCC CACAGTCAGC TAATGGATGG 64 8 0 

ATCACAGGGC TCCCAATGGA GGAGCTAGAG AAAGTACCCA AGGAGCTAAA GGGATCTGCA 6 54 0 

ACCCTATAGG TGGATCAACA TTATGAACTA ACCAGTACCC CGGAGCTCTT GACTCTAGCT 6600 

G CAT AT GT AT CAAAAGATGG CCTAGTCGGC CATCACTGGA AAGAGAGGCC CATTGGACAC 6 6 60 

ACAAACTTTA TATGCCCCAG AACAGGGGAA CGCCAGGGCC AAAAAGGGGG AGTGGGCGGG 67 20 

TAGGGGAGTG GGGGTGGGTG GGTATGGGGG ACTTTTGGTA TAGCATTGGA AATGTAAATG 67 8 0 

AG CT AAAT AC CTAATAAAAA ATGGAAAGGA AAAAAAAAAA AGAAAAGAAA GAAGCTACGT 6 8 40 

C T C T AG AG AA AACTTTTTTT TTTTTTTTTT TTTTTTTTTG GTTTTTCAAA ACAGGGTTTC 6 9 00 




38 

» • •••• • 

• ••• •••• 

• 9 • • • • • 

TCTGTGTATA GTCCTGGCTG TCCTGGAACT CACTCTGTAG ACCAOGCCGG "(S€TA¥GCCTC»«" ***9 6 0 ••" ••* 

CCAACTGCTG GGATTAAAGG CATGCGTCAC CACTGCCCGG CCAGGGGAAA CTTTGAGACC 7 02 0 

ACAAGAATGA AGAGGTCAGA GCCATTTTCC TTATGAAGGA GGCTGAGGCT CCATTCAGGA 7 0 80 

ATTGTGGGTA TGCTCGGATC TCAAGCCTGG TCACTTGGAT GGCTTCTTGT AGAGACCTTT 714 0 

AGCTGCATCT GTCTCCAAAC TGCTTCCCAA CCCCTGGAAC GGGCTCTGAA GCTGTCCTTG 7 2 00 

C C TAT AG CAT GCAAGGCCTT GTGAGTACCA GGTATGAGGC CTGATTGCTA GAGAAGACAG 7 2 60 

GATCTCATAG AGTCTCTTGC TATTTGCAAT AGGGATCATT CTTGGAATAA TCCGAAAAGT 7320 

AGAGTTTAAG AAATTTTGAA GAAAAAAAAA TCTAATATTA CAGATTCCAG ACTTGTTATA 7 3 80 

TAGAAGAAGA AGAAGAGGAG GAGGAGGAGG AGGAGGAGGA AGAAGAGGAA GAAGAAGAGG 74 4 0 

AAGAAGAAGA GGAAGAAGAA GAGGAAGAAG AAGAGGAAGA AGAAGAAGAA GAAGAAGAAG 7 5 00 

AAGAAGAAGA AGAAGAAGAA GAAGAAGAAG AAGAAGAAGA AGAAGAAGAA GAAGAAGAAG 7 5 60 

AAGAAGACGA GGAGGAGGAG GAGGAGGAGG GGGGGGGGAA GAGGAAGAAA GAAGAAGAAG 7 62 0 

GAGACGGAGA GAAGAAGAAG GAGAAGGAAA AAGAGAAGAA GAAGAAGGAG AAGGAGAAAG 7 6 80 

AGAAGGAGAA GAAGGAGGAG GAGGAGAAGG AGAAGAAGAA GAAGAAGAAG AAGAAGAAGA 7 74 0 

AGAAGAAGAA GAAGAGGAGG AGGAGGAGGA GGAGGAGGAG GAGGAGGAGG AGGAGGAAGA 7 8 00 

AAAGTGAACA GTAGGGATTG GAGAGATGGT TCAGTGGTTA AG AG C ACTG A CTGCTCTTCT 7 8 60 

GGAGGTCCTG AGTTGAATTC CCAGCAACCA CATGATAGCT CACAACCACT TGTAATGGGA 7 92 0 

TCCGATGCCC TCTTCTGGTG TGTCTGAAGA CAGCTATAGT GTACTTGTAT TAATAAAAAT 7 98 0 

AAATAAATCT TTTTTAAAAT TTTTTTTAAA ATAATGTGAA CAGTAACTGC TGTTCTCCAA 8 04 0 

GTGCCCCTGT TGTCATTTTT AAAAAGCCAT AGTTCTTTCT TTCATGGAGG GTGATCAATC 810 0 

ACAAGGGTCA CTGCATACAT CTAGGATAGA AGCTGTGTTA CAT AG ATT C G GTGTGTGGAG 816 0 

AGTTGCTGAG TTCCTCTCTT TCCTTCTTTC TCAAAGG TAT CAGCCAGGCG TCATAGTCCC 822 0 

ATCTCGTGTC TCAGGCAGCT ATCCTATCTT CTCTTCCCTC TTTGTGACAT TGATGACCAT 82 8 0 

TCATCCAAAC AAATGGAAAC ACTTCCCATG GGCCATTCAG TGCAAGTCTT CCACGTGGCC 8 34 0 

TTGCTTTGTG CTGGGGAAGA GTGTAGACCT CAGCTGTCTC TTGAATTCTG CTAGGGCCTG 8400 

GTAGTCTAAA CTGCCAGAAG GCAGCAACCT CTGCATTTTG TTCATCCATG TGGCACCAGT 84 60 

CAGTGTTGAG AGAGAGAGAG AGGAGAGAGA GAGAGATTAA GTACAGTCTG TCTTTGCAGA 8 52 0 

TCCTTGAAGA GTGGTTTGGC CGCACTATCA TCCGTTCTTG C AC C AAACTG AGCTACGACC 8 580 

ATGCCCAGAG CATGATCGAA AATCCAACTG AGAAGATCCC TGAGGAAGAG CTTCCCCCAA 8 64 0 




39 




TTTCTCCAGA 



GCACAGCGTC 



GAGGAGGTGC 



ACCAGGCAGT 



CCTCAASCTGn •CAO&GCAT?®" 



CAAAGCAACT CCGCCGCCAG CGCTTTGTAG ATGGCGCACT CCGTTTAGAT CAGGTCAGTG 
AGTCTCTTTT GTTTTATGTG GTCTTGAGTT TGGCTTGTGC CCAAAACTCA AGGGTGAGAA 
ATATCCTGGT GGCCTCTTTC TCTCCACCTA TTTCCCCTGC CCCTGCCACA CCATGGTAAT 
ATGAGTTAGG GTAAGATGGT ATCTGTGTAC AGAGTTCTGT GACTCCCAGC TGCTCTTACC 
TGGAAAACCT GTGTCCATGA TTGAATTCTC ACTTGTAGAT GGCATTGCTG TGACAGGTCC 
CTGGGACAAA GAAGGGAGGA AGG AC AT AT T TTTGGCTTGT GGTTTCAGAG GCTCTTGGAA 
CATAGCTCTG TTGTTTCTGG CCCATAGTTG GGGGCGGGGG GTGGCATGTG AGAAGTATGT 
GGCCCAGTGG AGCTGCTTGT CTCATGGCAG CCAGTAAGCA GAGAGACAGA GGCATGTGAA 
GGAGCAGAGG CAAGATAGAC TTTCCAGGGT ACACCCCCAG TGATATCAAT GAATCCAACA 
GCTGGTTCTT TGAGAAGATA AGCAAGATTG ACAGACCCTT GGTCCAAGTA GCCAAAAGAA 
ATAAAGAAGG CCCACATTAA CAGAGTCAGA AATGAACAGG GAAACATTAC AACAGATGCC 
TAAGAAATTC AGAGTTTCAT AAGGGCATAC TTTAAAAAAC TGTACTCTAT TAGAAATGGA 
TGAGTTTCTA G ATT C AG CCA AACCACCAAA ATTAAACCAA AAAGAAGTCA ACAACCTAAA 
CAGACCCATA ACAAATAAGA TTGAAACAGT AAAAACAAAA CAAAACAACA AAAAACTTCC 
AGCTACAAAG AAAAATCTAG GGCCAGATGG ATTCACAGGA AAATTTTACC AGATGTTCAA 
AGAAGATTTG CACCGAGTTG TCCTTAAACT ATTCAAAAAG TAGAGGCAGA GGGAGCACTC 
CCAGGTCTCC TCTGTGAAGC CTTTATGT C A CCAGTTCTCT CCGCTCATGG AGATTACTTC 
CTCTGCTCCT TGCTTCATGC TTGGTGTCCT GAGGCTGCAG CCCACCATCC TGTCATCTCC 
ACCAACAGTC CCTCCCTGAT TCCAAGAGGC TAAGTTGATG CTAATGACAC CAGAACTTGT 
GTCTGACCTT TCTCCCTCAC TCAAGCCTAG CTTCTTTACC TGCCTTATCT GCCTGACTGC 
CCTTCAGCAG CACAGTGGTG CTCACTCACC CTTCCTTCTG CAGAAAGCAG TGCTTGATGC 
CCACAGCATG GCACACAGGC TTCCCAGCAT CCTCTTCTCC CACTGATACA CTGGAGCATT 
ATATATGTGC CCCCAACCCA AGTGT AC C AG TCGCACAGAT TTTTGTAATT ATGCTTAGAC 
TAAACATTAG ACAGACAGAT CATATACAAC TCTCAAAAGG AAGCTGTTTA TTCTGTAAAC 
ACATCCATGT TTTAGAAAGA CAAGTCTTCA GAATGTCTTT AGGAAGACTG AAGTCACTTT 
ACAAATGAAC CGTGGGGCTT AGGAAAGTCT TTAGAAAATG AATTGGGTTT AGTTTTCTCA 
AAAAGACTAG GAATCTATGA TGTTGGCACC TATAATCTCA TCTCTCAGGA AGCCAAAACA 
GGAAGATTGA AAGTTCAAGG CCATATAAGA TGTATGTCAA GATCATGTGG CAAGGAAGAA 



8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
972 0 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
103 80 



TAAGAGGAGG AAGCAGAGGA GGAGGAAGAG 
GAAGAGGAAG GAGGAGGAGG AAGGAAGGTG 
GTTTTCTCTC ACTCTGTAGC TCAGGTTGAA 
CTTCCCAAAT GGTAGGATTA TAGGTGTGAG 
TAAGTCTTAC TTTTTTTCAA AAATGGTTTA 
ATACAAAATG TTAGGTTGTA TATTATGTAT 
AACTTTTACA ATGAAAAACC AGCTGTTACC 
TACCATTTCC AGATGTTTCC CCACTAAGAT 
TCTGTGAAAC TGGAGGGAGG GGGAGAAAAT 
AGGTGTGGTC AT CAT C G T AA TG AC CAT AG A 
CTGATACTCA GAATTGTATT ACTGAAAAGA 
TAACTCATAA ATGAGAAGGC TGAGGTCCCC 
TCCAAGTAGC TCTTTGTTTG GTTTTCCTCC 
AAAGTTTGCC TTTAAAGTGA AAGGGGAAAA 
AATTAAGGTT TGAAAGTAAT GAATTTGTAT 
AACAAGTCTG TAGACCCCCA CATAAGATGG 
GTGAGGCCGT TTATAAATCA GCTAAATGGC 
GTCCCTGTTG CCTTCTTTGC CCTCACAAGT 
TGCTGTTTGC CATTGTTCTC TGAAGCTTTG 
GGTGGTAGTC CTTTAAAAAG CACATCCTTT 
AGCCAATCCA AAGGCTTTGC CTTTCAAAAA 
AAGAAGAAAG CCCAAGCAAC AAAAAGGGGC 
AAAAGGCAAA AAGGCAAAAC AAACTGCCCA 
CAAAAGGTGA TTCTCCTTTG CCCCAAAAGC 
TTTGGTCGCT GAGTTGAATG ATGACCCTTC 
AGCTACCAGG GTAGTTCAAG GACTTGGTAC 
ATATGTCTCT CCCGAATCTT AAAAGAGGCC 
AAGAAAAGGA ATCACAGTGG TTCCTAATAT 
ATCTGAGGGT TTTTGCTCCT GACTAGCACA 
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G AAGAGG AGG AAG A<X AG€ A ASAGSAGG AG» • * "l 9 4 4 0 • • " « • * 

GAGAGAAAGG CAATAAAAAG AATAAATTTA 10500 

CTTGAACTCA TGGCTAGCCC CCTGCCTCAG 10560 

CCACCAAACC AGATACTAAC TTGTATTCTT 10 620 

G AAAC AT ATA TCTATGTAAA TTAAGTTATA 106 8 0 

GCCTTTTCTG CATGATTCTC TTATTTACTT 1074 0 

CAAGCCCATC AAATGAGGAA GTTTCTGAAG 10 8 00 

GCTATAATAA AATTCAACTG G ATT AATTC A 10 8 60 

AGCGGCAACT TATCTCTGTC CCATTGGAAG 10 920 

TTATTGATGG AGAATGAGCA GTTAGTATGT 10 9 80 

CTTTAGATAT CTGTATCCCA GTGGGCCTCC 110 4 0 

ACAGGTAGAT GGGTTGCTTA TTGCCAGGCA 1110 0 

ATTTATTACA CTATGCTGAC ATAAGAGAAA 1116 0 

CACCCTCAAA AACCTAATTA GGTTCCAGTT 11220 

CCTTGGAGTT GATCCCTTCA TTCGCCAGAA 112 8 0 

AGACATCAAT CTTTGCAGCC AAGGACACTG 1134 0 

TTTATTCAGA AGCCCTGCGT TTGTTCTCCC 114 00 

TCATTTTTCC TTGGTGCCTT TTCAGTGGCC 114 60 

TCTGCCATAG TTCACTGTGT CCATGTTTTG 11520 

TATGTCAGCA GCAATTAGAG ATCGGTCTTC 115 8 0 

AACAAGGGTT GAAGAACCCG AAAAAGAACA 1164 0 

CTGGTTGCAA AAGCAAAAAA AAAAGCCCCA 117 00 

ACCAAAACCG AATTTAAAAA AAGTTTCCTC 117 6 0 

AACACAGGCT TCCAAGGCTA TCTAGTGATT 1182 0 

TGAGTGGCTT GTCTCTGAAT CCATGTTTTC 118 80 

AAATGACCAC TTTAATTATT TGTTTATAAT 11940 

ATAATGGGGC CAAGACTTCT GTATCTGTAG 12 000 

CCATATACTG AGTTTGATGC AAGGGGAGCC 120 60 

GGCCAGCCCT CAGCAGCTGC CATCTAGGGG 1212 0 
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GGAAGATAGA TCTGCCTGGC ATGGGTGTAT TTAAAACCCT GAAACCCITT TGGGGTTCT.z?' 
GGTCAGCTAT TGCCTTCAGA AAGGATATGA TGGTAAGGTA ATGGGGTGCC AAACAGATCC 
TCAATATAAG ACTAACATTG GCTGATGTCA GGAAACTCCA CGCCCTGCTT TCTGAAGCTC 
TCTGAACCTG TTTCTCTTCA GCCAGGCTAA GACTTCTATG TGAAACAAAC TAGAAGTTTG 
CAGAGATCAG ACAAGTTCTC CCAGCAGGCA GTTAAAACTA TGAATTCGGA GGGCCTTGGA 
AGTCAAATGA AAAAAACCTG AG AAAAATT C ATATAAAGTA AAGGAGGCTT TACTAAGTTC 
TCAGCTCTGT CATCTCTGAA ACCTACTTGA CACAGTTTTG AGGCCCAAGC TCCATGCAGT 
TTCTTTGTAA AGGTAGCCTT TCTAATGGAA GACACTTTTG AATACCCTGG GACTCAAGCT 
GTGTGAGTCT GTAATGTTTG ATCCTAACCT AGCATAGCCT TTCAATCAGT GTTGGCAGGC 
TTTCCCAGGA AAGGCCAGAC AGTAAATGAC ATGAGCTCCT GGTCCATATG GTCTGTCTCT 
GACTCAGCCC TGCCTGTTAA TGTGCTCCAA ATGAATGGGG GTAGTTGAAG GTCACTAAGA 
CTTGGATTTG ATATCATTTT CACAGACCAC AAAATATTAT TCTTCATTTG ATTATTTTTC 
AAGTATTTAA AAATGTAAAA ATTCTTCTTT GCTCCCCGGC CAT G C AAAG C AAGTTAAACT 
GTGTCCCACA CATCACTGAC CCTGCTTAAC TGACCAACAA GCTTTTCAGC CCTATTACCC 
GCCAAGCCTT GAGCAGCTCA TTACCACTTC CCCAGGAAGC CAGGCTAGGA AATGGAGAAC 
AGTTGGGCTA AGTGACTTCT CAGGATGGTT CCATACAATT AAGTAAATTA TTCTTTTGAT 
TAGTACCACG CTTAGGGGGC CAGTTGGAGG CTGGAAGTAA GAGTGACTGA CCCCCCAACC 
CCAGCACAGT TCTTTTGCCC TTCCCAAGGT CCAGTCCCTT TAGCTTGAAG CCAAAGAGTC 
AGCACTCTCT TTACTCCTCT GCAGGACCCT CAGGGTCAGA GCAGCCCTCC CTCTCCCCTC 
CCCTAGCTCC CCCTTCTCCT TCCCTCCCCT GGTCCTCTGA AGGTAGAGAC TACTCCAGGA 
AGAGCAGGCT ATGAGGAAGG TGGGTAGCTT CTCTCCTGGC TACCTGTCTG CAGTGCTAAT 
TACAGCAGAG TGTTCCTTCT CTCTGCCATA GATAGCTGCA TTCTGGATGG CTGCTGCTCA 
GTGTTGCTCT CCGATGACAT TGGTGTAGCT GTGGAGAATG GGCAAGCCCT TCTGGTTTCC 
TTTAGCTTTA GTGTCTGTGT CAACTCAAAG TACAACATAG TCCAAGGCCC AGGCTCTGAG 
GTTTTTCATT C AG AG AG T T C TTCACTCAGC ATAGCTTCAG AGACCTGTTT GGGGAGCCCA 
GTGTGTGTGG AGGGGGTGAG AATGTAAATG AGGAATGAGA AGTTTCAGGT ATGGGAAGGG 
AGGCAGTGAA CCACTAGACA GTAAGAAGCA CTGGGTGGAA GTGCTTGCTG AACTTGAAAC 
TGAGGAATGA CTCCTGCCCA AAACCAGTGC TCATCCTTAG AACCCTGAAG AAATCCATGT 
GCCTGAAGCA TACTGTCTTA GTTAGGGTTT TACTGCTGTG AACAGACACC ATGAC CAAGG 
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12360 
12420 
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CAAGTCTTAT AAAAAACAAC ATTTAATTGG GGCTGGCTTA CAGGT*TCAGA (SGTTW^GTCC** 13*9 2 0 ** ** 

ATTATCATCA AGGTGGGAGC ATGGCAGTAT CCAGGCAGGC ATGGCCCAGG AGGCACTGAG 13 980 

AGTTCTATGT CTTCATCCAA AGG CTGCTAG TGGAAAACTG ACTTCCAGGC AACTAGGGTG 14 040 

AGGATCTTAT ACTCACACCC ACAGTGACAC ACCCATTCCA ACCAGGTCAT ACCTATTCCA 14100 

ACAAGGCCAC ACCTTCAGAT GGTGCCACTC CCTGGTCCAA GGATATACAA ACCATCACAC 14160 

ATACCAAGAG CTTTCTGTCC TCTCTGATCT TCAGAGGACA TCATTTGTAA CTCCTGTCTC 142 2 0 

TTTGTGCCTT TCACTTCCTG TAATATGTCA CAGGAGTCAT TTGTGTTGAC CGAAAATCCC 142 80 

TCTGTTATTT ATCATACACA CACACACACA CACACACACA CACACACACA CACACACACA 14340 

CACACACACA TACACACACA CACAGTAGCT CTGCGACTCT TTAGGGTAGT GACAGTGGTT 144 00 

CAGTGGGCTT CTGCTACTTC CAGGCCTTCC ATTTAAATGT AGACAGCACA TGGCTTCACT 14 4 60 

TGGATATTTA GCAACTCACT TATTTCTCTA CTTTCCTGCT TATTTTCATT TGTAGATCCA 1452 0 

GCTCTCTGTG ACACTCAGAC CTGGACTCTC AGGGGTAGCA GGAAGGGTGG GGAGCTGCAC 14 5 80 

CCTTCACCAC AGAGAATCAG AACACAGCCT ACAGTGGGGT CTGGAAACCT TTCCTTTGAG 14 64 0 

AGTGACAGAT CAGTTTAGTT ACTGTACATT AATTTCATAT GGAATTACAG AAAATAGTCA 14 7 00 

T AC TT AT G C A CACATCCTTC CTTGTTAGAT GAATTTCTCT GGGTGGCTTG TTAGTACCAT 14 7 60 

CTGCGCTCTC CCTATACTCA CTCTCCCTGT GACACAACAT AGAGCCATTT CTCCCACTTC 14 82 0 

CAAAAACTTC AGAAAATCCT GTTTACCTTG GAAGTTGTTA TGAATGCAGA CTGACACTTG 14 8 80 

ACCAGTGGCC ATTGCTAGGT GCCTCTTGAG TTCTCTCTCC AACAGCAGGA ACACTGCTCC 14 94 0 

TAACACTGCT CCTACAGCAG TGGGAAGCAG ATGTCCTACC CTAAGACTGC AT AC C AAGT A 15 00 0 

GAGGAGAACA TATGGACTTA GCAAAGGAGG CCGAGGGGAT CTCAAGCACG ATGGGGAGTG 15 0 60 

GATGGGAGTG AAGGGCAAGG ACAACCTGCT CAAGACAGCT GTGCCCACTG ATGAGCATGA 15120 

GAAGAGCCAG AGGCAGCTTC TCCTCCTCTG AGCTGAGGCT GAGACTGGAC ACTTGTGACA 15180 

CACGGAGGTG AAAGTGGCTC TGTCTACCCC GAGATGGTTT AGATGAAAGG AGGCAAAAAA 15240 

GTAGCCAGAG ATAGAGCCAC ACCCTCTGCC AGCTGGAACA CTTGGGATGC TTCCCCACTC 15 3 00 

CTCCACCTCT GCTATTACCT TGACTGTTGG GTGTCTTTCC AGGCAGGATG TAGTGAGGCC 15 3 60 

TGAAGCTGGA ACTGCTGCAG TTGGTCAACA GGCCTGTTCA GAAGAACACT GAGTCTGCTT 1542 0 

TCTAAGTAAC TCTAGAAAGC AAGTTTGGCT CCTAGCCCAC CTCTAGAAGC TTTTGCTTGC 154 80 

CTTCTGGTTC ACTCTGCATG TTGATGTCTA GCCTCATTTC TTCCAGGCCA AAAAAAAAAG 15 54 0 

CATTGCTTCA TGCCTGCTGC TATATTCTCT GGGTTCACCT CTCTCTGGAC CTGAAGAATC 15 6 00 
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TGAATACTGA AATCCTCTGC TTGTTCCAAG TGGGGCTGGC TCGGCCAACC CTCTCTCfCA 15 660* 

GGGTGCCATA GCCCTTCATG CCTATCTTTG TCACACTGTC CAGTTGTCTT GTTACCCCCT 15 720 

CTCTACCCCT GTCTCCTCCC CTAAGATTCA GTTCCTACAG AGCAAAGACC ACATGCTATT 15780 

GATCTTTCTA TCCTCACTTC CTGAACAGTG CTGCATTTTA ACAAGCTGTT TGTTCAGGGT 15 84 0 

CTCTAAACAG TGCCATGCAT GCTGGTCTTT TTAAATAAGG TACTGCTAGC TACAGTGGGG 15 90 0 

AGAATGGAAA CCAAGGCTGT AGATCAGAAT GTTTGCATGA GAGAGTTACT ATACAGTGTG 15 960 

AACCAAGGCT GCCCAAGTAA ACTGGCTGTT ACTTAATTCT TTGCCAGGGC ATCCAGCATG 16 02 0 

TAGAAGAGAT GTGGTGAGGA CTTTCTCAGG TGGAGCTGTC CTGATAGGCA TGAGGAGTCA 16 080 

GAAGGCTTCA GTATGCTTGG GGTCATCGAC ACTTCAGAGG TTCCCCCTCA GATTGGGATG 1614 0 

TCCCTGCTGG GGATGTCAGG AAGGACACTC CCAAAGTTCC AC C AG AG AAG AGAGATGCTG 162 00 

GTCTAAAAAG GCAAAAATTA CCTCCTCCCA GAGCTACTCC TCTTACCTCT GGAATGGGGC 162 60 

AGAAACAAGT TGGATAGGAA TGGCAACCTC TAGTCTTTGC AGGATCCTGA GAGGACTCCA 1632 0 

CCCCTACCCC CACCTCCGTT TTGCTCAGAA TGGAAATGGC GGCTACCAGA TAAAGACTTT 163 80 

CTATTGGTCT TTGGGGCTTT TTAAGAAGAG AACTTAAATA CAACCCAGGT TACTCAAACA 16440 

GAAGTTGCTG ACCTTCCCAG GGTACAGTGG AGGGGAGGAA GGGCTCTCAT GCTGACCAGA 16500 

AGAGACAAGA ACTTCTGTGA CTTAAACAGG GCATGGCTAG AACCCTCATT TCCTCAGAGA 165 60 

TGAGATTATT TTGTCTTATG ACCTTGACAG ATGGAATGGA ATTTGGCCCT TCTGGGACTT 1662 0 

TGCCTTTTGG GTAATTGTAC TCAGTTAGGC AACCCTGGGA CTCTCTTTAT T C ATAGG AC A 166 80 

TACTGCATAT TCTTGCCCTG CCCCCATGTC ACACTCACGT CAATTGAATG TAAGCCAGAC 1674 0 

AGCTACATAA GAAGCATGGA ATGCTTTGAC GTTGGTAAAA CCTGCATTGG AGAAAGAGAA 168 0 0 

CCCTTGCAGC TG AT C C T TAG ATTTCAACCA TGACTGCTTC TTGGGACTGG CCCAGTTGAT 168 60 

TTCAGTTTGT ATTCTTCAGT GCGCTCGGGA CTCTGTTTCC TAGGCCAAAG CTCTTCTGTT 1692 0 

CTGTTCATTC TACACTGAGC TCCTGCAAAT GTTCCCTTGT CCCTCAAGAA CCTGCGGGTA 169 8 0 

T C AC AG AC C A ATGGCAGAAA TGTCTGGGGG ACAACATACA GGTGTTTTAT TTTAC C AC AC 1704 0 

AAGGATATAT TAAAAAAAAA AGTTAGGGTA GTGGTGGCCC ACGCCTTTAA TTCCAGCACT 1710 0 

TGGG AG G C AG AGGCAGGTGG ATTTCTCAGT TTGAGGCCAG CCTGGTCTAC AGAGTGAGTT 17160 

CCAGGACAGC CCAGGTTATA AAGAGAAACC TTGTCTCAGA AAAAAAAAAA TTACTAAGCT 172 2 0 

AGGGCTATAT AGCTTAGCTG TTAAGTGCTT ACCCAACAAC ATGAGACCTT GGGTTCAATT 172 80 

TGCTGCACAA CATAAACTGT GTAGTGGCCA CACACCTGAA ATCCCAGCAC TCATGAAGTA 173 4 0 
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GAATCAGGAG AATCAGAAGT TCAAAGCCAG TTTCAAATAC AGAGAATCTtS AGTCCAGCTT IfiOO ' 

GGAGTGCATA AAACCCTGTC TGGGAAAGAA AAAAAAAAAA AAAAAAAAGC AGTGTTCCCG 17460 

TACACATGAA GCATTCTATC CCCAAGACAA AGGAAATACA CGATGTGACA ATATGAAGTA 17 52 0 

GGTTTCTAAT ACATTTTTAG TTATTTGGGG AGTGTGAAGA TATGCATCAC AG C AC AC AAA 17580 

TGACGATCAT AGGACAGCTT ACAGCAGTCA GCTTTCTTCT TATACCACAT GGGTCCGAAG 17S40 

ATGGAACTCC AGTTGTCAGA CTTGGCCGCA GGCGAGTTTA TCCACTGAGC CTCTCTCCGG 177 0 0 

CCATGAAGCA GTTACTTTAC GTTGACTCGC TTGAGCTTGT TGGGAGCATG CTTAATTATT 177 60 

GCTTTGCTCA CTTTGGTTGC CTCAGAGTAG CTTGCGAGAA TTACTAGACT CACACGTTAG 17 82 0 

ACCCAGATGT CTTCTGCCTT CTGATGAGGA GCAAGCGTGT GAGTAAGGAG GGGAAGCAGG 17880 

TCACAGTCCA AGCCGCTCAA GTCTGAGCTG CAAATCCTTC ATTGTACAGA CGGCTCCGAA 1794 0 

TCAGAACACT TCCTGTTGCT ACAGTCAGGA CGGTTATAGT TTTTATTGTT ATAAATGACA 18 000 

TTGTAATTAA TACCCTTACA CAGAAAGTGT AAAAGTCACT TAGAAATACA AACATCATAA 18060 

ACTACTAGGT TGAAGAAAAT TGACTTTTTC TGTGTCAATT CTTAAGATTA ACTTTGATTA 1812 0 

TTTTATTGTA AAATGAATAT ATGTTCATAC TGTAAACATA TTTAAATAAA CAAGGAAAAA 1818 0 

GTAGCCATTG GCTATGCCTC ACCTAGTAAT AATACTTAAT ACTGTTCACT TCAGAGCTTT 1824 0 

TGGCTTTCTG GGTGTTTTCC AGAAGGTTGG ACTAATTGAG GTTTACCCCA TCAGAGAACA 1830 0 

GTGCTATGCT GTTACTCTTC TCAGCAAATT CAGTTTGTGG CTTTGCTTTA ATCTTTGTTA 183 6 0 

GTGTAAGTAA CTTGGAAGTG GTGTTCCATT GTTTGAGTTG CCTTTTTTCC TCCTGTGTCT 18420 

CTATCAACTC TCAGGCCTGT CTTTGCCAGG TCTGTGGAAA GCAGATGCTA CATCCCATCC 184 8 0 

CTAGGACTGC C AAC AG CATC AGCACAGGCC CCTGCTCTGA TCAAATACAA CCACCTTTTT 18540 

CCCTATGAAG AT AG AATT AT ATACAATAAA GTCCACCATC TTTAGTGTAT AGGTCCACAA 18 600 

GCTCCACACA TAATCATATG TCTACCATGG T C AAAAT AC A GAATAGTTGC CTCACCCAAT 18660 

AAGCTCCACA TGTGCCCTTC GGTAGGCAGA CTGTCTCACT TATCCTCAGT CCCTAGTAAG 1872 0 

CCACACATGA GCACATGCAT ACAGGGTACA AAGGTCAATT TAAGGTACCA TTCTTCAGGT 18780 

GCCCTCTACC TTGTTTGTTG AAACCGGATC TTTTACTGAG ACCCAGAGTC ACCAATTGGC 18 840 

TCGCCTATCT AACAGTAAGC TCCAAGTATC GTCCTGTCTC CTCCTCCCCA GCACTGGGAT 18 90 0 

TACAAGCATG TGCCACCATG CCTGGCTTTT AATGTGGGTT CTGGAGACCA AACTTAGATC 18 960 

CTCATGCTTG CATGGAAACA TGTTCCAACT GAGCTATCTC CCTATTCTAA TTTTTGCCCA 19020 

TTTCTTAGGT GGGTCTTTTG GTTTCCTAGT ACTAAGTTTT GAGGATTCTT TTGCTATTTT 190 8 0 



• • • ••• ••«• 

»•• • • • • •«• ••• 

• • • • • • • 



AAATAGAACC TCTACCAAGT TGTGTGATAC TACAAGCCAT CCAGCTCATT •CTTflJCATCCC »19141D 

TTGTCTTATT CTTTCTGGCT CTTCTTTATT CCCTTTCTTT TGAAAAGAAG TTTTTAATTT 192 0 0 

TGAAGCAGTC CAGTTTACCA ATTGTGTCCT TATGTTATCA AATCTAAGAT TTTTGTTTTG 19260 

TTCGTTTTGA TGGTATTATT ATTTATTATT ATTATTATTT AATGTATGTG AGTGCTCTAT 1932 0 

CTGCATGTAT ACCTGCATGC CAGAAGAAGG CATCAGAACT CATCATAGAT GGTTGTAAGC 19380 

CACCACGTGA TTGCTGGGAA TTGAATGAGG GACCACTAGA AGAGCAGACA GTGCTCTTAA 1944 0 

CTGCTGAGCC ATCTCTCTAG TCCTATTCAT TTTTTTTTAA ACAGTCTTGC TATGTAGCTC 1950 0 

AGACTGGCCC CAAACTCAAG ATCCTCCTGA CTCAGCTTCC CAAGTGCTGA GATTACAGGC 19560 

TTGTTCCTCT AACTCCTGGC ATGAGAAATC TTTAACTGAC CTAGAATCAC AGATTTTCTT 1962 0 

CTAGAAGTCT TATAGCTTCA GAATTTATTT CTACTTTCTC TCTTCCTTTA TAAACACATT 1968 0 

CCTAGGCCCA GACATTTCTT TTGGAAAAAA GTTCCAATAA CAGAACTGGA CACACCTGAG 1974 0 

CAGATGTAGG GTAGAGTCAG ACCTGGGAGT CTTGCCAGGC ACAGTACCCT CCTGGAGCCA 1980 0 

TCTGCAAAGA AGTTACCTCA GGAGTGGCTT GTAAGCAGAT C.TTCTCTGGT TTTAAAGACT 198 6 0 

TGGCATAAAA CTGAAAAGTG TATCTTTTGA ATCAGGGAGC AGAACGATAA G AG AG AAAT C 19920 

TCTCAGCTCT CTAGACAAAT CCTCTTGACT ATCACAGAGC TGATGGTGAG CGGAGCCAAG 19 98 0 

CAAGACTTTG TCGATTACAT GCAAACGCCC AAGTCAGTGA CTCACTCAAT CATGCTTTAA 2 0 040 

TCTCATAACT CAGTGGCTTT AAAAATTACA GTCAACAAGG CAGCTCGTGG GTTACAACTG 2 010 0 

CCATTGGAAC TAGGTTTTCT CTGAACAGCT GGAGTGTAAT GTGGTGGGAA GAAAGCCTGC 2 0160 

TGTGGGTGAG AGGCCAAAGA CTGTTTGCCT GGGAAGGATG TGCAACTAAC GTTTGATAAA 2 0220 

AATCTGTGAA ATGACCACCC TCAGCCAATC TAAGTAGAGG CCTGCCATTT TCATCCATGG 2 0280 

GAAAGTGCAT C AC AG C AAAA GCATTCAGAA GGCACTGGTA AGACAGTGGC AGTCACCATT 2 0340 

CATCAGACAA GACAGCCCTG ACTTCAGGAA GTGTCAGGAG TCAGAGTATG AGTATGGAAT 2 0400 

ATTAACAGAG CAGGCAGAAG ATTCCAATTC TAGTCAAGGA GGGCCAGTGA GAGAGAACAG 2 0460 

TTTGGGAATG GCTTCTCTGA ACAGATCCAG GCAGATCAGT GCAGTCATTT GCTATGTTCT 2 0520 

AAAATGTGTA GGCCTCTGCC ATAGCTGTGT CACGGAGGAT AT AT AAAC AG GCTGTTCTTT 2 0580 

GAGGACCTCA TTGGGCTGTC CCCAGGCACA AACATTTTCT TAATTTCAAT GTAGAAGCTG 2 064 0 

TTACCCACAG GAGAGATGGA GTAGGACTTT GGTTTCAGAG CCCTATCTAT AGCAGCTTTG 2 0700 

TTGAGACCTA ACTGGAAAGG CTCAAGATAG GACATCACAC AAGGCATTTA GAAGCTTGTA 2 0760 

GCAGTCATCA GACATCAGAC CAGACCTGAC AGGAAGAAAC AGGTGAGTCT CAAGAGGGTT 2 0820 
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CATCAGGATG CTCACGAGTT TCTGCCTGCA CAGCATGGGC ATATGGTATT ACCAGGAGAA 3 6 3 80. 

GCCATCTATC TGCCCATAGG GGACAAGCAG ACATCAGTTG GGTGATAGGG ACATGAAAAC 2 0 940 

TTTCTGGCCC ATCTTTATAT CTGTTCCAGT GAAAGATGTG TGAGGTCCTC ACCCCTGAAG 21000 

GCTCTATACT TCCCTCTCCT GCTAGACAGT CTAGCGAGAC TAGGAAGCAA CACAGAATCT 21060 

AGATGAGGCC TCTGTGAGCT GCCCAGGTCC TTAGGAGTGG AGTGGGGCAG GACCCGTTAC 2112 0 

AAGAGTACAC CCCCCGCCCC CGCAATGAGC CCAGTTGTTC ACTATGGGGC CGGGAACATC 21180 

ACCCAGCAGG CCCTATTGGT CCTGGCCTGC TCCCCTCCCT CCTTACCTCC TCACTCACTC 21240 

TTCCCAGCTC GATCTTTCTC GCTTGTTAGA GAGAGAAAAA AAGTGAATTC ACTCCCAGTC 213 0 0 

CTTTTGAAAC CCAATGTGTC AGTGATCGAT GAGGCTGTAT TCTCTAACTT CAAAGGAGAA 213 60 

AAACTAAGTA GAGTGAATAC TGGCCAGGGG AGTTGAAAAG TCCCAGGGAG TAGGAGACAC 2142 0 

AGGAGTGACC C TG C CAT CAT GAGGAGCACC CCCCATCCCA CCCCTGCTGG TGCCATGCAG 214 8 0 

AAGCACAGAC AATGCCACTT TCAGTAAATC ATGACGGATC CTGAATGCCC AGTTTTGTCC 2154 0 

TGTTTTCAAT GGGCTGTGGG CATATTGCTT AAG AT AT AG C AAGCCATTTG TGCTGGGTTC 2160 0 

CCAGCTACTC AAAGGCTCGA CATTTGAGTG TTCTCTCAAT TGTATAATAG AGCCTTTGCA 21660 

TATGTGATTT GGGGGGAGGG TTTTTTCCTC CAGATTTCCA TAGCTAATCA TAGTAGAGGT 2172 0 

GACCTCAAGT GTAGTGCAGA CCATTGTCCC TCTTCACCCC TGCAGATCTT AGCAGTGCTG 217 8 0 

AGCTTTAGGG ATATTCAGGC AGCACCTAAT TCAATCACAC ATCTGACCCC TGCCTCTTTG 21840 

GCCACTCCTC TGAAACTCAG TTAGCTCCCT GGGGTCTCCC ACCCCACAAG CCTGGATCCT 2190 0 

CAAGAGCCTT TGTACTGAGT AGAAAGTGCT CAGACCTTCC TCCACCCTAT CCAGATTCCC 21960 

ACTCCCCCCG CCTGAATTTA AGCACAGAGA ATCCAGTGCT GCAGGGCCAC TTGTTCTCAC 2 2 020 

AAGGCTGCAC TTGTGGAGAT GCCTGTGTGA AGCACCCTGT AGACATCCCA TGCTAAAGTC 22 080 

TTGGGAACAC AGAGAAAGAA AACC CTGGGG TCATTTAAGG GCTGGTGTGG TCATTTACTT 2 214 0 

AATCATCTGT G AC C AG C AAG GGCCTTGTTT TCAGTAAAGC TCGGAAGCTT CCTTGGCTCT 222 0 0 

TTATCAATCA TAACAAACAG CTAGAATTTA TTGAGAGCCT TCTCTTTGCC AAGTGCTTCT 222 60 

ACTTGCTAAC TTTAACTTCC TCCACCCTCA AGCCCTCTAC CCATTTTTAC AGATGAGGAA 22320 

ACTGATGCTC AAGGTTGAGG AGTTGTCAAA GAGTACACAC TGGCCAGGAT TACGGAACCA 22 3 80 

TCTTCTGCCA CTACTGCCTT TCTCTTGTTG GATATGGACG CTGTGGTTTT ATACTCTACA 2244 0 

CAGTTTAAAA ATGGTCGAAG TTCTCAATTT AGGGCAACTT TGAAAGGCTA AAGTGCTGTG 22500 

TGAGTATAGT TTTTATAATG ACAAAATTCC AGAAGAGGAG ACTAAGTGAA TAGTTGCTGG 225 60 
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ATGTCAGAGC TAATGTTGCT AGGAGGGAGG CCCATGTCCT GGGACCG/TCtI GGTCTG3?C*TC \ .2 2*6 3 0 

AGGGGCAGTG GCAACTGTGA GGATCCAACC ATGTGTGCAG AGTGGCCCCA ATATGGACAC 2 2 680 

ATTGTGACAA TTTCCTGAGC TATAACCATG TAAGATGTAA CCTTTGGTGG TAATTGAGTG 2 2 740 

ATAGGGACAT GAAAACTTTC TGGCTTATTA TTGTTGTTTG TTTGTTTCTA TTAATTCTCT 2 2 800 

TAAGTACCTC AGAAAAAAAG TGCTACTTAA TTCCATTGTG TCAAGATGAC CCAGTCTCAG 22 860 

ATCAAGAGCC ACATTCTGCC CAAGCAGTTC ACACCATGCA ATTTCAGGAC CTAGGAGGGA 2 2 920 

ACAGTGTCTA GCAGAGAGAC CAGATTTTAA TGCCAGTCAG ATGTAAGCTG AGACTCTCTT 2 2 980 

TCCCTTTTTA TGGAAGTGTT AAACTAAGGG TTGGATGTTT ATACCCCAAT CTCAGGGCTG 2 3 040 

TAGTTAGGGA C C C AG AG C AA GTTTCTCAAA TTCTGTAACC TTTTCAGTTC CTAGCTGTCA 23100 

GGTAGCTATG TGAACTGTAC CCATCTCTAG AAGCCAGTAA GAGAATCCAG TAGAACCTGA 2 3160 

TGGCCTAAAA TTGATGTCCA GGTCTTACAG AGTAAAGAGA GAGAGCTGAC TTCAGCAAAT 2 3220 

TGTCCTCTGA TATCTACACA TGTGTGTACC TGAAAACACA CATCCCACTA ATAAAATATA 2 3280 

TTAATGTAAA CAAAAAAATT AAAACTTTTT TAATAAAAGA AGAGGATCTA GCGAGAACAC 2 3340 

ATCCTGCCAA AAAACAAAAA AAATTTTTTT TTAAGTTACA GGTAGTGGTG AACTGCCTAA 2 3400 

AATGAGTGCT G AG AAC T AAA CTTGGGTCCT CTGGACAAAC AGCAAATTCT CTTAACCCCT 2 34 60 

GAGCCATCTC TCCAGTCCTA GCCTTACCAC ACTCGTCACA GAAAGATATG TTGAGCTCAC 2 3 520 

TCTAGACGAC TTATTGCTAG CATGAGTATC TGTCTAGTCC CATGTCTAAT CTTCATGATG 23580 

TAATCAGACC TACCCAGCAG ATAGCAAGGC AGCAGTAAAT GCTCTTTTTT ATTTTTTCTG 2 3 640 

GACTTGGTCA TTTATTTCTT CACTGTTATT ACTTTACTGA AGATTTGGGC TGGCACTGGT 23 700 

GATAAACTGA TAGGTATACC CAGGTGGTCT CTGCCTGTAT TTGTTTCTCC TCTATTGCTA 23 760 

TGACAAAACG CCATGACCAA G AC AAC TT AA AAAAAAAGAA AGCATTTAAT TGGGCTTATG 23 820 

GTTTCAGGGG GCTCCAGTCC CTGACGATGG AGCAAAGGCA TAG CAT C AG C AACAAGTAAG 23 8 80 

AATTCACATC TTG ATC CAT A AGCACAAGGC AGAGAGCACA CTGGGAATAG CACCAGTCTT 2 3 940 

TTGAAACTTC AAAACCTGCC TCCAGTGACA TACCCCTTCC AACAGGCCAC ACCCCAATCC 24 0 00 

TTCCCAAGCC ATTTCACCAA CCATTCAAAA TATATTCACA ATATATGAGC CTCATGGTGT 24 0 60 

TCTCATTACC TG AG AC C ACT AAAGGGCTTC GTATTTCCTA TCACATGGAA TCCTCCCATC 2 412 0 

ATGTCTTTTA TAACTTAGAG TAGGCCTATT CCATGTAGAC TCCTCTACCA GATCCATCTC 2 4180 

GGAGCTCCAG CAATGCAGTC ATGTGACTGA GCGTCTCTGC CAGCCTTTGC TCTGAACTGC 242 4 0 

ACATTCTGCC TCCACAGTGA CCAGAGCTGC AGACAATGTA TACTTAGGTC CATGCCCTAA 2 43 00 
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ACAATAGATC 


CTAGACACAG 


AAGTCCTCAG 


CCCATTTCTT 


CAGAGAAGAG 


OAGTftGCT'SC 


2^360* 


TATGTTAATC 


TTAGTAGCAG 


TGGTGGTTGT 


TGTTTTTTCT 


TGGTTCCTGT 


CAGTCAGTAT 


24420 


TTTGACCAGC 


TGACTAACAT 


TTCTTATTTC 


AGC CTTTTGC 


ATCCTCTGAG 


AGTAAGATCC 


24480 


TCTTGGCTTC 


AGTTCTGGTC 


TCTTTACTGA 


TTTTGAGTAC 


AACTGAGCCA 


TGTTAGCTGG 


24540 


AAGGCAGACA 


TTGAATGGAA 


AAG TAG AG C T 


AGCATGCCTG 


TCTCTCTCAC 


TCATTGTACC 


24600 


CACCTCTGAC 


AGGGTATGTA 


AGGGTACCCG 


TCCCTCAACC 


CAGCCTCAGT 


CAGCCCATGA 


24660 


CTCTGGATGG 


GCCAGTGTGG 


TTAGCCATTC 


ATGGGGGTTG 


CATGTCTTAA 


ATAAAAGGGC 


24720 


ATGGAAGGAA 


GCCTCTTTGC 


CTATGATCCT 


CAACAAGGTT 


CACATCTGAA 


TGCCATTTGC 


24780 


TGTTCTCTGT 


CTGCTTGAAC 


CTAGAGAAGG 


AGAGGTTGTA 


GCATGGGGCT 


CTTACATGGG 


24840 


AGATAGCAAG 


TGGGAAATGC 


AGACTTTAGA 


GCCAGGCAGG 


TTTGCATCTA 


TATGCCAGTT 


24900 


GACCAAGTGC 


TGATTTGCCT 


TATTTTAGCC 


AAATTACTAT 


ACCTACCCTA 


GCATCCATCC 


24960 


TGAACTCCTT 


TAAATAGTGG 


CAATGGTAAC 


TGGGCGTGTG 


ACCCTCTTGG 


CAACATTCCA 


25020 


GCTGCACAAG 


GAGCCTGTGA 


CTCCTGCTTC 


TCCTTTTAGG 


GCTTTATCTG 


ATCTTGTCCT 


25080 


TTGTGTGTGT 


GTGTGTGTGT 


GTGTGTGTGT 


GTGTGTGTGT 


GTGTGTGTAA 


TCTTTGTGGG 


25140 


GCTTACCCAA 


AGTTGGGTAA 


GTCCAAAGTT 


GGGACTTCTG 


TATTAGAACT 


AGGATGGTTG 


25200 


GGACAAGATA 


ATAGCTGAGC 


AGATACACAG 


TGGATATAGT 


GAACAGAACT 


GTATACTTGC 


25260 


ATTTGGACTG 


CCTAAGCCAG 


TCTAGCAGGT 


TGTTGTGGCT 


GCTTCCCTGC 


CCAATCACCA 


25320 


ATAGACAAGT 


CTACTGGAGC 


CAAGGTCTGA 


CTGGGCTTCT 


ACCTGGCAAG 


ACACATCTGC 


25380 


CAACCCAGCA 


TGGCCGTCTT 


AGGTTGTTTG 


TTTGGGGATT 


TGAGGAAGGG 


GTGAGAGTTT 


25440 


ATTTGGCTAT 


TTGCTTATTT 


GGTTAATTTA 


TTAGTATTCT 


TGTTTGGTTG 


ATTGTTGTTG 


25500 


TTGTTGTTTT 


TGAAACAAGG 


TTTTACTGTG 


TAGCCCAGGC 


TGGCCTCAAA 


CTCTCCTGCT 


25560 


TCAGTCTCCA 


GAGTGCCAGA 


GTTAGATGCA 


TGTAATCCCA 


TCACTAGTGG 


AAGCCTTACT 


25620 


TTTGAAGAGT 


GTAGCTCAGT 


TAGAGGTATG 


TAATGCCATA 


GGCTGAAGCA 


GCCCTAGAGA 


25680 


CCAGTCACCA 


AGGGAGAAGG 


TTGGGGCTAC 


CATGTGACAG 


AGGAGCTGTG 


TCAGCCTGGC 


25740 


CACCTGTGCA 


GTGGTGTAAG 


TACTACAAGA 


CTCCACTGAA 


ATCTGAGGCC 


CAGGTCTGCT 


25800 


GTTATGTTTC 


CCAGGGAGGC 


ATGCAGAGAA 


AAAGTGGTTT 


CCCTAATACT 


GCTCAAGTTT 


25860 


AAAACAAACA 


AACAAACAAA 


CAAAAAACAT 


GGTGGTAL1 1 


ULL. J. 1 1LA1A 




25920 


GACAGCAGAG 


GTAGGTGAAT 


CTCTGTAAGT 


TCAAAGCTAG 


CACTATGTTC 


AAGGCCTGCC 


25980 


AGGGCTGCAT 


AGTG AG AC CC 


TGTCTAAAAA 


AGAAAAATGA 


AACTGAACCC 


TGAAGTTGTA 


26040 
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GAAACTGCTC AGATTTCAGT GAGTTCTTTT GGACTAACTG AATGAGCJTTG • TTT^CAG'C.GCC m a ?6V%3 

TTATTTTTTC TCATGTGGAG CTGGCACATG AGCAAGACTA TCCCCAGGCT TTGCCACTAC 2 6160 

AGGATCACCA TTGTGGATAG GTCATACTGT TGGTCTGTGA TTTTCCTCAC TTAATTTTCA 2 6220 

CAACAATCTC AGAAGTGCTG TCATTATCTC CTATAATTCT TCAGAGTCAG AAAATGAGGT 2 6280 

ACAAAGAGGT AAAAGAAGGA AGATCACCTA ACTATTAGGA AGTAAAACTG GGATCCAAAG 2 6340 

ATGGGTGACC TTTTCTTCTA GTGTAATTTG CCTTCTGACG TTGTAAGGCC AGGGCACAGC 2 6400 

AAAGGAGACA GAAGCAGAAG TGTGAGCCCT TAGAATGCTA AAAAGAAAAA G AAAGT TAG A 2 6460 

GTGGGGAAAG ATCTAGACTA GAACAGTTAG ACTTGGTCTG TCTTCTGAAT TCTAGCTTTG 2 652 0 

GAGCCCCCGC AAAGACTGCA TGTTATATAC AGCATAGAGT TAAAAGGAGC ACAGGTTTCT 2 658 0 

GCTTAAGAAA GAATGTGAGC TTACTTCATT AACATTCAAT AGTATATATA GCTTCTTTTT 2 6 640 

ATATTTCACA CTTATTTATC TTGTGTG CAT GTATATGTGA GTATATACAC ATGCCAACTG 2 670 0 

CACACATGTG GAGATCAAAG AGCAGTTTAT GGAAATCAGT TCTCTCCTCC TACCATGTAA 2S760 

GACCCTGGGA TC AAAGT C AG ATCATCAGGC ATCAGCAGGA GCCTTCTCGC TGGTCTCCAT 2 6 820 

ATGCAGTTTC CTAAAGAACA AGGTTATCCA AGGGCTCTCT CACCACAGGT GAT C ACAGTT 2 688 0 

ACATCACAGT TAGCAAGGCC AGAAGAATGC AAAGAATGTC TTTATTTCCT TCCTGGAGCC 2 6 940 

TGGCTCCTGC CCTCCTAAAC TTCTTAAATT TTGTTTAATA TTTAC AT CTC TTCTAAGATG 2 7 000 

TAAGTACTTG TGATGTCTTT AAATTTCACA ACACCCATGT GTTCCCTGGT TTACACTACA 2 7 060 

AGTAGGGCAG CATCTCTTAA ATAATGTTGT TCTAGAAGGA AGAGAGCTCA GATACAAGTA 2 712 0 

GCAACCTGGA TAGGAATAGC AATTCCAGCT ATTGGATACT CACTGGATAT AGTTCTAAAC 2 718 0 

AGTCTAATCA GCAGTTGTGT GATCAGTGGG CACTTAGGGC TGAATGGTAG AAGAGTAGCT 2724 0 

CTCATGCCAG GAAATGCACC AAACTCACCA GAGCAAGCAC AGACAATGGA GGAGAGACAG 27 3 00 

GTGGCTTGCC CCAAGACCCC CCAGGAGCCT AAGATGGCAA TATTGTCGTT TTGAATACAT 273 60 

TGTGCAGGCA CTTGGCCTCT GGGAGGGAGG AAAACAATTA GCTTAGCATC AAATCATGAA 2 7420 

CTCTGACAAC TGCTCTATCT TATATAAGAT CTCCTTACAT AAGGATGCAG AGAGAGCATC 2 7480 

CTCATTAAAA CACCTCAAGG GGTTCATACT GATTTTCTAG AAGCAGAGCT TCTCTCCCAA 2 7 540 

CAAATACATC AGGACTGGCT ATAGACACTT TTTTCTTCAA TAGGCTAAAA AGATCCCACA 2 7 600 

TTCCTCCAGG AGACAAACCT C AG AAC AG C C ACAGAGGAAC TGGGCTCCAT GGTATAGGTG 2 7 660 

GGGCATCTAA GGTCCCAGAG CCCACCTCCA TCCAGACTCA G GG AG AG AAC AGGCAAGCCA 2 7 720 

AATCTGCTGG CTCTCAATTT GGTTTACATA ACTCCTGACT CCTCAAGTCC CTGGAAACTG 277 8 0 
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AGGCCAATTC CCTGGAAGAT CATTCTGTTC TCTCCTGTTT TTTCAAGAAG AGAGGCACMC *3?84o!' 

TGATCACTGG CTCCGAAGAC TGTGTGAGAG TGTCCCACTT CCTTCTTCCA CGAACTGAGT 2 7 900 

GTCTGCCGTC ATGGCTGTTG TTTAGGAAGG TTCTGTTTGA ACTCTCATAA CTCCATATAT 27960 

GTTGACCTTG TATTATAAAG AACTTTACTT ATCTTATGTG TACCCTCCTC TGTTTCCAAA 2 8 020 

AGAAAATGGA GGACTTGCAG CAAAGGAAAT AAGTAAGGTG AATACATTAG GAGAAGTGAG 2 8080 

AGACTGGGAA GGGAGGCAGA CAGAAGGTGA GCTCCCAGTA TCTGTGTGCA GAGTAGGCAC 2 814 0 

CAGACTCTCT ACTGCAGTAT CGCAACAGCA GAAGCAATCC TACCTCAGAG AGTTGAGGGG 2 8200 

GAAGGTAAGA AGGCACATTT TTTTTTAAAA TAACAAACTT GACTGAAAGT TGAAAGATGT 2 82 60 

GTTCCTAGTA CTAAGAACAG TTTCTCATGT GAGGTTGCCT TTAGGGGCAC TGCATACACT 2 8320 

TGTAGCAATG AAAAAAGATG TTTATAGGCT CTGTCTTAAG GTAAACTTGG TGAGAATGGA 2 83 80 

GGGTAACTAA AACAACTTAA GGAAGGCCAT GAGTCTGGGG AGCACTAGCT CTTTTGGAGC 2 844 0 

CTCAGTGTGT CCTGGGTAAA GTTGGAGCAT CCTTGTGGTG GCAGCTCGAT TGGTGCACTA 2 8500 

AGTGCAAATG TGCACCAAGT TCTGGACTCA CTCTTCTCGG ACACATAGAC TGAGTGTGGC 2 8560 

TCATATCTGT AATC AC AG C A CTCAAGAGGT GGAAGTAGAA GGATCAGAAG CACAAGATGG 2 8 620 

AACAACCTCA GCTCTATAGA CAGTTTAAGG CTATCCTGGG CTACCTGAGA CCCTGTCTAT 2 868 0 

AAGCAAATGA CTAAACAAAC AGACAACACA CTTAATTTTT TTATAGCAAC CACTTTGAAG 2 874 0 

TGGGAGGGGT CTGATAGGGT CTCTATTGTT CACAGCAAGT GCACAAGGTC AAGAGTAGCT 2 880 0 

AGGCAGATGA AGAAGAGGCC AAGACACCTG AACAGTATCT TTCCCATGGG TTCGGAGGAG 2 8 860 

CCACGTGCCA CCTTCACAGT C AG C ATTGTC TGTGCGAGTA GCTCTGGCAG CATCAGTGCC 2 8 920 

CAAACAACGG CTGATACGAG TCCCCAGATG CAAGAGGAAA TAGTTGTCTG TAATTGCCTG 2 8 980 

TTTTAAGTAG AGTGGTCAGG AGGCTACAGC CTCCTCATCG GGCTACATGT GGCATATGCA 2 904 0 

GGCTTGCTCA TCAGACCTTG TATTTACTGT TTTCACCTTA ATGGAGAATG GGAGAGGCAA 2 910 0 

ACAAAGCCCA GGGACTTTGT GGAAGCTGAC TAGAAGCCTC TGGGACTCCA GGGACTGCCA 2 916 0 

ATCTGCTAAA GAAGAAGCTA AGAAAGAAAA TGAGCTCCTC TGCATGGGTC TCCCCATGAT 2 9220 

GGAAACAGAA GGCCACATGG CACAGTGTAA ATAGAGCCCT GCTGCACTGC TCTTACTGTG 2 9280 

GTGAATGAAG AAGAGGCAAC TAGCCAGGAG GGCAGGACCA CTACTACTGT TTTGCTGGCT 2 9340 

GGTTCCTCCC AAGTGAGCAG CCTTCCCTGG GGACAGACCT TAGCTCTAAG ACAGACGTGG 2 9400 

CTTCTTCGGA GCAAGTCAAA CCTCAACATC GAAGAATCCT TGTCTTGTCA GTTTTAGCTT 2 9460 

TAACAAGAAT AGAACAAGCT TCTGGAACAG GACACAGTGG AGTCAGGAGA AGCGGCCTTA 2 9520 



51 



• • • • • • ••• ••• 

■ • •••• • • 



AGTGAAGACA CAGCTGTGGG GTTTCCAGAC TCGCACTGCA GGGAGGCGTC ATVCACJtGGG ** 2 95*8 0 

AGCGGCCAGC CTCGCTGTAG ACTTCCAACA CTAACGAATC GGGAACTCCA TGCTGAACAG 2 9 640 

GATTTAGTTA GAGGGTCCCT GTGCCAGCAG ATGGATGTAT TTTTCTTGAA AGACCAAGGT 2 9700 

GCCAGAACTC TTCATGATTA CGTTACTGGA GCAAGGTCCT TTTTTGTGGT TTGTGAAGTT 2 9760 

GAGCGTCAGG ACTGCAGGAT TCTCTTGCTC TTTCTTACTC TTATTTTTTC CAGGTCAGAA 2 9 820 

CCAGAGCTTG GAGCAGGGAG GAAAATCCTG CTGAATGAGC AAGTTCTTTC TTAAAAAGCT 2 9880 

CTTCAAGTCC AAAAAGACTT CAGTGGACTT AGGAGAAAGA AATTTAATAC ATTGCCATAG 2 9940 

AATCGTTGTT AACCAAGTTA AAGCAAAGCC CACAGCATCT TTGTCTTATA AAAGAAAGCA 3 0000 

AAGAGGAGAT GGAAAAAAAG AAATAATGCT TAGGAAATCC AAACCAAACA ATGAAGACTA 3 0060 

ACGAAGGAAA AC TAAAG AT C ACTTCAAAGA ATGTGAAGAT TCCCTCCTAA TAAGATTTTT 3 012 0 

CAATTTTCAA ACCTAAGCTT CAGGTGGGAG GACCTTTTCA GTTTTTTTTT TTTTCAAGTA 3 018 0 

TGCTGTTAAG TGGCATTCCC CAAAATGTTG GCCCTGTGTA GGATTGGCTG CCTTCCACAT 3 0240 

AAGGAGCAGT C AG AT AC C C T GCAAGACCCA GGAACTGAGG GAGCTTTAAC CATGGGAAGC 3 0300 

TGAGAGGCTT G C C AG AC TG C TCCTTGACCT GAGCTTGAAC CTGAGTCCTA ACTGCTAGCA 3 0360 

AACTGAAACA AGCCCAGCCT CCAGGAGAAG AAAGTGGGCG GAACTAGAGC AGTCCTAGCC 3 0420 

AGAAAACTAT GCTCCTTTCA CCACTGGCTC TGTCTTTACA TCCCTGGGAG GGAAGCCTGG 3 0480 

GTTGGGCTTC AAGATCGCCT GCTCAGACCA TCCCTCTCAC TTGCTAGCCC CTTCCAGGCC 3 0540 

CACGCAGAGG CACTAGTGCC TATGAGAGGT CAGTTTGCAT CTGTTGTGGA CAAGACAGGG 3 0600 

AATTCCTTGA CATTTTTAAT ATTTATTTAT CTTTGTTAGT GTGTATGTAT ACACACACAC 3 0 660 

ACACACACAC ACACACATAT ATGCACAAAT GTACCAACAA AAAGTTATGG AGCTTGTGGG 3 0720 

GGGAGTCAGT TTTTTTCCTT TCACCATGAG GATTCCCAGA ATTGAACTCA GGTCATCAGA 3 0780 

CTAGAAGCAA GCATCCTCAC CAACTCAGCC TTCTCACTAT ACCTTGCATA GAGTTTCTCA 3 0 840 

ACTTTTGCCT AAGCTCAGAC TGGTAGTTTT TTGTTTTTGT TTTTAAAGAT TTATTTATTT 3 0900 

ATTATATGTA AGCACACCAG ACACACCAGA AGAGGGCATC TTATGTCATT ACAGATGGTT 3 0 960 

GTGAGCCACC ATGTGGTTGC TGGGATTTGA ACTCAGGTCC TTTGGAAGTG CTCTTAACCA 310 2 0 

CTGAGCCATC TCTCCAGCCC CAGACTGGTA GTTTTTAAAA GCACCAGAAG TTCTGAGCTT 3108 0 

CCATCTTCCT TACTCAGTGA GTTTAAGAAG CACCTGCCTA GGCATGATAT TCTCCAGGGC 3114 0 

AGGCCATTTG GGCAGGCCAT TCTGTACATC TGAGCCTGTG AAAGACTGGC TTGTTCATTG 312 0 0 

ACCCCAAGAG ACACCTGGCT GCACACTGAC CACCCTTTCC TGTTTCATTC TGTCACCTTC 312 6 0 
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TGTTGCTTAT TCTTATGAAC GCATTTGAAT CCACTGACTT CACTGGGCSX? GGM , &J&A& * ?3b3fr(£* * **! **I 

TAAGGCCACG TGCCTTTTAC TC AT CAT AG A AAACAACTAT AGGCCTCCTA GCCTCCTGCT 313 8 0 

TAGCCTTGGA CATTCATTCT CTCCCTAGTT TTGCTCACAA CATGGTAGAA TCTGAGACCC 314 4 0 

AAAAGGACGC CCTTTATTTC CTCAGCCAAC TAGTAGTGTG GTTCCTGGGA GGAGACACTG 315 0 0 

CTGGTCTCCC TTGCCACTAT AGTAAAACCC AAGAGGTGCA ACAACCCCCG AAGAGCTTGC 31560 

TTCCTACCTT CCCCAAATCC GTGGGAAAGT TTGCCATCCT GTCCCAAGGG TTTCAGCCTT 31620 

TATTTAACTC AGCCTTAGTC CTATGGCCAG ATGCCTTGTT CACCCCTATC ATGGAGCCTG 316 8 0 

GACAGTGAAG GGCCCCATCA GAAGTTTTAT GTTCTGCTGC CCACAGCTGC TCTCCTGTGT 317 4 0 

GGTCTCAGCC TAAGTTTCTA . GAAATAAAAA GCTCTCTCAC TCTCACACAT GTTCATTCTC 31800 

TCTCTCTCTC TCTCTCTCTC TCTCTCTCTC TCTCTCTCTC TCTCTCTCTC TCTCTCTCCT 318 60 

TCCTTCCTTC CTTCCTTCCT TTCTTCCTTC CTCTCCTCCC TTCCAACTCC TTCCCTCCTT 31920 

CCTTTCTTTT ATTTCTTTTT GTGAAGCAGA GTCTCTTTAT GT AG AC C AGG CTGGCCTCGG 31980 

ATTCATAAGA GATCTGCCTG TCTTTGCTTC CCGAGTGCTG GAATTAAAGG TGTGTACAAC 3 2 040 

CACACTCAGA ACTCTTCCAT TTCTACCTAA AGAAGACCTG TTTGTCCTTT GTCAAGCTGA 32100 

GAGCCTTTCG TCTCCCTAGG TCCCTTTCAA AACTTTATTC CTGTGGCAAT GGCCTAGAAG 3 216 0 

CCAATCCCTT TGAGAGGACC CACTAGCAGT CAGTGCTTCT GTTCCATGTA GCAGCTGCCA 3 2 220 

CCAGAGTGGC TTCCATTCCT GCTGGCTGAC TTCCCACTGA GGGGGGCCTA CAGAGCTTCG 3 2 280 

TATGTGCCCC AGGCTGGCAG AGAGGGCAGC AAGGAAGGCT CTGTTCTGGC AAGGCTTATG 3 2 340 

GTATAGGAAG TATCTAGGAA ATACTGTTGC TCTTCAGGGT GCTGACAAGA TAGGAGCTCT 3 24 00 

TTCTTGCTTC CCGGGGATTT GGACCCCTAG TTTCAGTAGA GCTGGTCTTT GTTGACTGTC 3 2460 

TCTGCCTGGA TGTCCTCTGC TGTAGGTCTT TTGTTCTGCT TCTCTTGGGA ATTCTTCTGC 3 2 520 

TTGCTTTCTG GCTGGAGGTA CTGGTACAGC TGCACTAGCC TCTATACTCA TTGTACACAC 3 2 580 

TCCCCTAGCT TGTGGGCCTC AGTTGAGTCA CACATCCCTT CATGAGCTGG ACACTGCCAG 3 2 640 

CATGGATATC TGTTCAGCAA CTAAAAGGAT AGGCCTCCCT TAGCACTGTC AGGTCCAATC 3 2 700 

TTTCTCTAGA GATTGGGTCT GCTTTTCCCT GCAGCCCCTG GATGGCACAT CATTAGAAAG 3 2 760 

AAGGACATGC CTTCCAGTGC TGCCTCTGTT TCTGCTTACA GGGATAAGTA TGTTTATTCA 3 2 820 

TTC AT ACT G A ACTTTGTACT TGTAGGCACC TCCATGCCTG TAGACATGCC TGATGGCTTG 3 2 880 

ACTTCTCTGA GAAACACATC ACTGTCCTAG G TAG ATTTTA GAACTTAAGA GAATGGTACC 3 2 940 

CACCTTGTCC CATCCCTACC TCTCCACTCC TTGGCTTTTC TTTGAATATT TTAATTACCT 3 3 000 
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GTCCATC CTA AGGT CACACA CAGTCTAATG TCTGGACACA GTTCCTC£CA; CC^CtCTA'GA '.J3'$£t> 

GTCCATAAAT AC CT AGGAAG CCAGTACAGC TTTACAAAGA AGACTGCTTC TTCTGACTGG 3 312 0 

CCCTTATGGG CCTAATACAT ACCAAATCTC TCAAACACAG TGTAGTGTGA GAATCTAATA 33180 

AGATCATATG AAGAATGTTT AGAGCAGATG TACTTCATAA ATATTAGTTT CCTACAGAAC 33240 

GTCTGTCACT CAGACCCTCT GCTTTCTCTC AGTTGGGCTG CATTTCTCTC TCATGTCTGT 333 00 

CAGTACTTAG TTCCCTGGCC CGTCTGTATC CATCTGTTGT CATATCGTAT TGCCCTCCCT 333 60 

TGCCCATTAT TCATCCCTCA AACCTTTCTG G AAAGATC C A GCTTTGGACC AGCTTGGCTT 3 3420 

TCTTCTTCAT ACTACTGT C A AGGCTGCAGA GGGTTGTTCA CTAATCCTAG CTACTGAGTG 3 3480 

CTCTTTGGTG GTCCTCCTGC GTGGCCCCAT CTAGGTCTTC GTCTTGTCCT CCAAAGATTT 3 3 540 

GACTGCAACC TTCATCCTTT CCTCAAATTT CTAATCTCTC AAACTCTCCA TTCTTTGCAG 3 3 600 

ATAATTTGAC TTTCTAGTTC TCAGGAGGAC AGAAGCCATG CTAGAAAGTT CTAAACCCTC 3 3 660 

CTTACCTGGC CTACAGACCT GGCTCTGTCC CTGCTCACCC CTCCCATCTC TAGAGAAGGT 3 3 720 

CTTCCATTGT GTGTTGGATT CCAGTCCCTG GCCATCTCAG AAG C AAC ACT GTTTACTCCA 3 3 780 

TCTCTTGGGC TCCCTCTCCT ACTATAGTCA ATTCTGCTTT AAAATGTCAC TACTTATATG 3 3 840 

TACACCTTTC ACTCCCTTAC TCACTGTGCT GTCCCACTGT AGTCTCTGCT GTCTCCTCCC 3 3 900 

TACAGCCATC TAAAG C C ACT TTGACCTCTG TTTCCTTGCT TCTCACTTTC CAATCTGTCT 3 3 960 

CCTACCCACC TCAGCTCCCA CTACTACTTC CCTCCAGCCC TTTCTGCCAG ATCCAGTGGG 3 4 020 

GTCCCTGTTT GGGACACACA CTCCTCTCCT ATGTGGCATT TTAGGAGGGT ATAACAAACT 3 4 080 

GACTTGGCTC TTCCTTCCTT AAGAATTCCC CCTTAGCTTC TTCAAGACAT AAATCAAGAC 3 414 0 

CCACAGCCAC CCTTCTTGGT CTCTGCTCCC AGATCTCTCA TGGAGGTGTT CTTTGGACTC 3 4200 

CACTAGGATC TTCTTCCTCC CATGCACTCT CTCAAGACGA TCTCACCCAC TGCAGCTAGC 3 42 60 

TCTCATCTTG CCAGTTGAAG CCTGCACATT CACTTGGACC ACACATACAG CAGCCTTCTG 3 4320 

GCCATCCCCA CCAAAAACAA AGAAACCAAC AGCTCCAAAT AGGACCCAAA CTCACCGCCC 3 4380 

AAGCTTACCA TCCCGCATCA CCTGCAGGAG TGGCCTCACC ATCTGTCCCA CCATCTGAAG 3 4440 

CAGAGAAACT GTGACACCTC CATTCCCCTG CATATCCAGA CCAGCAAAGT TCCATAATGT 3 4500 

TCTTAGCAAT GGACAAAGAG AGTGAGTTTG AGTTAAAACT CTAGTTCTAT TGTGCTGTGG 3 4560 

ACAAATTCCT TAAGGATTTG TTTGTATGAG TTTGTTTGTG TGTGTGTGTG TGTGTGTACA 3 4 620 

CATGTGTGTT TGTGTATATG TGGGTATATG TGTACGTATA GAGATGTTCT TGTATGTGGA 3 4680 

AGCCAAACAA CCTCAGGGGT AGTTCCTCAG GTGTTGTCCA CTGCTTCTCG TTGTTATTGT 3 474 0 
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CTCTCACTGT TCTGGGTTTA AGAAAGCTAG ACTGGCTGGC TACTGAGT£C &AG3ATCTCC " 8*0*i> * ••* •« 

TTATCTCTGC CTCCCCAACA CTATTACAGG CATGCTCACA GATGCACATC ATACCTAGCT 34 860 

TTTAAAAACA TGAATTTGGG GAATCAAATT CAGGTCTTTT TGCTTGAATG GCAAGTACTT 34 92 0 

TACCGACTAA GCTATCTCCT TAACCTCTCT CAACTGAGCT ATCTCCAAAG GCATACAGAC 3 4 980 

ACACACACAC CTCTCAACAG GATCTCAATA TGTAGCCTAG GTTGTCCTAA AAACTCTAAC 3 5 040 

CCTTCTGTCT CAGAATCTTG AGTACAAAAA CTGTGGGTGT TCATTACTGA ACTCAGTTAA 3 510 0 

ATTCTTAATC TTTATCAGCC CCAAGCTCTG CATCCATTAA ATGGAAATTA TAACACCTAA 35160 

TTCAAGTGGT CATCAGGATA AAGGAAAGCC TTCTTCACTT GGTGTGTGTT TGATAATAAA 3 5220 

AGTATTTAAA TAAATAAATA TTCAATAACT GAGTGCCCCT CTGTCCCTCT CTCCACCAAT 3 5280 

CGGACTTGTC TTGTTGTTAA ATTGCTGTTT CTATAGTTTT CTGACCTTGA AGCCCTCCCC 3 5340 

CTCAAGATCA CACTTACCAG TGTTTTCCTG ACTGAGGACC ACAGTGCCTG TTTCATCCCT 3 5400 

CCTTTTTTTA CTTTTGGGGC TAGGAGGCAG ATTCTAGAGT CCCCATTACA GGGTTTGATG 3 5460 

TGTCTTCTCT CTAAGCTGTC TCTAGATGCC CCCATCTCCA CAACCCTGCC TG AG AC C C AG 3 5520 

GCCTAATCTT TTTAGTCTGC CATGATGGCC TTGCCCAAAG CCCTTCTCCT GCAGGCTTGC 3 5580 

CTTCAGTTTA GCCCATCTCT CGCTGACCAC CAGGTGTCTT GTCCTCTGAC ACCTGCTGTG 3 5640 

CTTTCCTTTT CTTTTCTTTT CTTTTCTTTT CTTTTTTTCT CTTCTCTTCT CTTCTCTTTT 3 57 00 

CTTCTTTCTT TCTTTCTTTC TTTTTTCTTT CTTTCTTTCT TTCTTTCTTT CTTTTTCTTT 357 60 

CTTTTTACCA TGTGAATTCC TCATACTCTT ACATGCAGCT TGCTGCATTA GCTCAGCCCT 35 820 

CCTGCCTCCC TGAAGCAGCC TGATATCGTC CTCCTTGATC TCATTCCTCC CCCCCCCCAT 35880 

GTTCCTCTCC CCCCCCCCCC TCCACGATAC AGAGGAGGAA AG C ATTTGGG AGTGGTTGAG 3 5 940 

AAACTGAATC TCGGTACAGC G AC C AG TAG G ATAGACTGAG AC ATT C AG C A AAGACCAACT 36000 

CTACTGAACC CAGGAGCCAA AAACTCTGCA AAACAAGAAA AATGTAACAC AAGAGTGGGG 3 6060 

GCATGCTAGT CTTTACTCAA AATCAAAGTA GAGCTACCTT GTCTCGAAGA ATCTAGAAAA 36120 

TGCCAATAAA GTGGAGAATC CTCCCACTGG GCTGTTTCTC TCTCTCTCTC TCTCTCTCTC 3 6180 

TCTCTCTCTC TCTCTCTCTC TCTCTCTCTC TCTCACACAC ACACACACAC ACACACACAC 3 6240 

ACACACACAC ACACACACAC ACACACACAC ACACACACAC ACGTCTCTCC CAACCTTTTT 363 00 

GTTTTGGTTT GGTTTGGTTT GGTTTTTGTT TTTCGAGACA GGGTTTCTAT GTATAGCCCT 3 6360 

GACTGTCCTG GAACTCACTT TGTAG AC C AG GCTGGCCTTG AACTCAGAAA TCCGCCTGCC 3 64 20 

TCTGCCTCCT GAGTGCTGGG ATTAAAGGCA TGCGCCACCA CCACCCGCTC TCTCCCAACC 3 64 80 




TTTTGTTGAT CTATTTTTTT GTGGTTTCCT 

ATCTGCCCAC CCCACCATGG CTACCTGCTC 

GCTTCCTGAC TTTTG CTACC AATG CTGGTC 

AAACTGTTTG GCAGTGAAAC CTTTCTCTAA 

CAGAAGATGC AAAATTTTCT AAGAGTGTAG 

GACAAAATCA ATACACTGCC TCAGCTAGAA 

TGATTAAATG TTGTTGTAAT TGATCTGCTA 

GTTTTTTTTT XTTTTTTTTT TGCTTTGTTT 

GGAGGTAGCC CAGGATGGCC CTGAACTTTA 

AACCAAACAC ATGTACAACC ACACCTATCT 

•TTTGCGTTGC CCTTTCTATA CACGTGTACT 

TCTTGTTCCC ACTCCCCTGG CCCTTCCAAA 

ATCTAGATTC CATGCATGAG ACAGAATATA 

TAACAAATGT CAAATTTTCA AATGACAATT 

TGTGCTTATA CATGTGTGGT GCATGTTTGG 

ACCCTCAGCT GCTTTTCCAC GTTTCTCTCT 

CACTAGTATG GCGAGTCTTT CAAGCCGGCT 

GATAGGAATT CTCGGCATGT GTGTGAGTTC 

GCAAAAAGTG TTTTAACCAC TTGGCATTCT 

TAAAACTCCA CTGTGCGTAT GTAC C AC ATT 

^^^^ TAGACTGGTT CTGTAGAAGT GCCATGAAAA 

TGCTGACTTT GTACTCCCTT CAGACAGATG 

AGTG CTATTT TCTCTCTCTC TCTCTCTCTC 

TCTCTCTCCC TCCCTCCCTC CCTCCCTCCC 

TTGGAGAAGC CTCCACACTG ATTTCCATAG 

GAAATAGAGG CCTGCTTAGA GCCAAGGTAT 

AAGTTCCTGG CTTTGTTGTG GTAAAGAAGC 

TCAGTAAGAG GACAGACCAT TCCCAAGAGT 

CCAGTATCTA ATGGTGCAAA TCATTAGTTG 
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TAG C ATGCG A TCAAATGTJlT JjAG^JGC^TT 
TCCCACATGG ACTGCAGTGG GACCTGTCAT 
TTATTACCAA TGCAGTAGTG ATACTGAGGC 
GCCACAAATC CATAGCTTAA AATATTGAGG 
GTTTTTCTGT TTGTTCATTT GTTTTTAGTG 
AGAAAGAAGT GAGGCAAAAG GTCATAGTTG 
TACAGTGGGT TTTTTTTTTT GTTTTGTTTT 
GGGGATGTTT CCTTTTGACA CAGAATCTCA 
AACCTTCTGC CTCAGCATCC TAAATGCTAG 
ACTTATGTAC TAATT AT AC C AAATAATGGA 
TATACTTCGA TGGTCATGCC CATCACTGTG 
ATAGTTCCTC TCCTCTCCTC TCTCTTTTTC 
TTTGTCAGTC TAGGTCCAAC TTATTTCACA 
TTTTAATTCT TGTTTCTTAT TTCATTTTCC 
TGGGTGTGTG CATGCAGAGG CTTGGCAGTC 
GAGGCACAGT CTCCCATCAC GTCCAGGGCT 
TGCACTAGAG ATCCCCTCTT TCCTCTCTGG 
TGGGGAGCCA CCTCTGGTCC TCATACTTAT 
CCCCAGCTCT CATTCCTTTT TATTGCTGAA 
TTCTGTATCC CTTCTTCCCT TGATGGGATC 
CTGCTTTGGT ACAGATCGAT GTCTGTGTTG 
TCCAGAGGTG GTAGAACTGG AT CATAGG AT 
TCTCTCTCTC TCTCTCTCTC TCTCTCTCTC 
TCCCTCCCTC CCTCTCTTTC TTTCTTCTTT 
TAGCTGAACT AAATTCTTTT TAATTTAACT 
AATCTGTAAG AAAAGCCTTT GACTCCAGTG 
ATTTGTTTCT AGTTTGAGTG TTCATCTGGG 
GTGCTTTGCT CTGAGGGAGA GAAAAATTGT 
TGTTAATAAC CCTACAGGGG AAAAAAT CAT 
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36600 
36660 
36720 
36780 
36840 
36900 
36960 
37020 
37080 
37140 
37200 
37260 
37320 
37380 
37440 
37500 
37560 
37620 
37680 
37740 
37800 
37860 
37920 
37980 
38040 
38100 
38160 
38220 
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AATAACGTAT CCCCCTTTCA TGTACTTAAT GTAGCTAAAT TTTCCCTA&T j3AC?JTAAWfe '.3,82*^3* 

TCCATGGAAT TTTTGGAGAT AGTAATTGGC TCCACATTGG AAATGCTCAA GCTCCCTGAG 3 8 340 

CCCTGGGCTC CAGTAAGACA GGTAGTAAAC CTGCCTGAGC CCTATGAAGC CCTGTGTTCA 3 8400 

CCTGAGGTCT CCTTGCCAGA GTCCCAAAAG AAACCAGGAC TCAGCAGGTT GTCTTTTCAT 3 8460 

CTTCACTTAC AGGGTCGCCA AGTCAGTGTG CTCCTAACCT AATTCTGAAC TCCCTTCTTT 3 852 0 

CCCCCACAGT GTAATATTTA CCTAACTGGT TGTTCAAATC AAACCTTGAA CCTTGGTTCT 3 8580 

CCTTTGTCAC CATATCCATC AGCTGTTGAT TCTACTTCTA AAACTCACTG CCACTTAGAT 38640 

CTCCCGAGTG TCCATTTCTC TTCATCCTGC CTACCTGCCC TCTGGTCTCC ACTCCCATTC 3 87 00 

CCTTAGGAAC AGCCCTGTGT AGGCTCCCAT TTCTCTCCTC TTCCTTCAGA CAGCACAGTA 3 8 760 

GCCAGCTAAA AGGGTCTTCC CAAACTGAAC TGTGGTGACA TCATCCACCC CTTTCTTAGA 3 882 0 

GCAGATCACG ATCCTTCCTT TGTAGTTAAA GCAAAGGTCA GAGTCCAATA TAG C C AAG AG 3 8880 

TGCCATGCAT ATTTTGCCTG GCCTTCCTTC CACAGTGAAC CACCCACTGT GATCCTTGTA 3 8 940 

GCTATTGGAC CCAGCTTCTG GCCATCCTTC AGTTCCTGCA GCTCCTGCTC AGGACCTGTG 3 9000 

TATATGCTGT GACTTCTGCC CAAGACAACT GTCTGTTCCC TCACCTGTGG GCTCATCACC 3 9060 

CCTCCTTCCC ACAGCCCTGT TCTGCCTGGG TCAGCTCATT TGCTTCTCTA GAAACATGGT 3912 0 

AAGTTACATT TTGCCTCCCA TAAAGATTCC AAGAACCCTC TTCAGTTCAA ACTTCTACAT 3 918 0 

ATACCTGGCT GTTCCCTACA ATAGAGGTTT GCTCTTGTGA CAGACAGCAG GCTCCACAAA 3 924 0 

GGTGACCCCA CTGCTGTAGT GCTCCTGTGT CCTCTGCTAG CTCAGAGGCA GGTATAAATG 3 9300 

TGCTTTCCGA GTACGAATTA CATGGCCAGT G CAT AAG ATG CCCCTGGTGG CAGTACCTGT 3 93 60 

GGATGGCAGA GCTCCAGTGA CAGGACTCTG C C AC AGTG AG AGGTTGGCGT TTCCACAGCA 3 942 0 

CATCCACTGC AGGGAGCTGA CTTGTTTGAT TCTCCCTCCG TTGAGCCCAA ACTCACTGGT 3 9480 

TTTTCTTTTC TCTTTGTTTA GCTGAAGCTT GCTTTTACTC TGGACCATGA GACTGGATTG 3 954 0 

CCTCAAGGAT GTCACATCTA TG AG T AC CG A GACAGCAACA AGTAAG CCAC TCACTCAGGG 3 9600 

GAAAGCATCG CCTACTTGCT GAGCAGCTGG GGCAGGCTTT CTGACTCGGG CTTCCCTTAC 3 966 0 

AGGGGTGCTC AACATTTTTG CTACATGTGA GAAAATGTCT GGCACACACA TACAAAATAT 3 972 0 

CCACCCCAAA AGTCTCTTTT GACCTTAAAT ATAATAGAAA GGAACTTGTA TAGAGGGCTA 3 9780 

GAGCAATGGC TCAAAGCACG TACTGTGAAA GTGTAAGGAC CTGAGTTTTA ACCCCCAGAA 3 9840 

CCCACATAAA GCCAGGTTCA AT AG C AC AAG TCTGTAACCC CAGTATTCCT ACGGTGAAAT 3 990 0 

GTGAGAAAGA GAGAAGAGAG TCCTTGAAGG T C AG AT AG C C TGGTATACAG AAAGCCCCTG 3 99 60 
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TGCCAAACAC TGTGGAAGGT GAGAACCACA TTGAAGTTAT CCTCTGAffTC CJOTATTTCTT • 4>0TO<5 

CATGGCACAC ACT CATG AAC ATTTGCACAT AAATGTGTGT GTGTCACACC ATACATATAC 4 008 0 

AAT CAT AC AC GCATGCATGG AAATAAAGCA GGTGTAAAAG AGTTGGTTAA GAGTAAGAAG 4 014 0 

TGTGTTAGGA AACCAGCCCT CCTTTTCAGG CCCCACCCTC CTCCCCACCC CTCCCCAGTA 402 00 

CTCGCCCCTT GCCTGCTTAT CTGAGTCAGC TGTGACTTTG GCCTTGGTTG TGGTTCTGTA 4 02 60 

GCCACCGACT CCCCACTTAC TACTTCTGTA GTGATCCTGT GGCTGTGTAG TTGGGAGGTG 4 0320 

GACACAGATG CAAAGTAGTG TAGCCCTGTT AG AAAATGG C CCCAGCATAA TTTTAAAGTA 4 0380 

CCTTTTCTCT CCTTCAAAGA CTGATTCTCT GAGTGTGTGT TGTGGTGTGG TGTGAGACAG 4 0440 

GGACAGTGGT GGTGAGTGAG GCAGAAGAAA TATGCCTTGA TAATGCTGGT GCTGGTGGTG 4 0500 

GTAGTAGTGG TGATGGTGGT GGTGGGGTGA TGGTGGTGGT GATGATGGTG ATGGTGGCAG 4 05 SO 

CAGCTCACAT TTGGGCACCT GCTCTGCATT AGACTCATGG GAACCAGTGT GTGCCATTCC 4 0620 

TACT T AAC C C TCATCACAGC CTGAAGAGTG CTTTCATTAC TATGCACTGC AGAAGCTAAG 4 0680 

GCCTAGGGAA CTCTGCCAGC TCACTCTAAG TAATTTACAT ACACAGTCAA CTTTAACATG 4 0740 

TCTACAGTGG AGGAAGACTA GGTGGAAGAC AGTTGTTACC ACTCTGGGAA ACCATCCTCA 4 0800 

ATAACCAGTA GACCCAGCCT AGACTTGAGA ACAGTGTGTT CTGGTATCAT CATATAACTA 4 0860 

TCTAAACTAT GTAATCTCAC CCAGCTGAAG GAATAGGCAC CTGCCAGCAT AGCCAGCCAT 4 0 920 

GACCTCCCAG AAGAACTCAC TGCTCAGATG TGAGTAGAAG ATAGGTCAGT GTTACCCTTG 4 0980 

TGACCACATC CACATGCAGG TTGCCTTCTG GGT AT CATTG CAATGTCTGT ATCTTTAGGC 410 4 0 

AGATGATGTA CTTATTATTG G AC AAC AC T A ATTCCCACTT CATG AAC CAT GGAGAAGGCC 41100 

ATCCAGTCAT CCTCAATGCC TCTATCTCCC ATCTTGTATG GGGCTACATC TAGAAGGCAT 4116 0 

CCCAGTGCTT CTAAAGCCAT TGTGTCAAAA ATACCATCTT GGTTTCTTAT TAAGCTCAGG 412 2 0 

TCATCAGCAA AGTCAATCTG GGATTCTCTG AAGCCAAAGG CAAGATGGGA GAACTGAACA 412 8 0 

GATTCCTGAG TGGCTGGGCA AGCTTTCTTA GAGACTAAGC ACATAACCCA TAAACAGTAC 413 4 0 

AG CAT AC CGT TCTGCTTCCC TTCCCTTGCT CCACACTGTT CTCCATGCCT CGGCCCTCAC 414 0 0 

TCTTAGCCTC CAACTGCTTG TCAGGATGCT CTGTTTACTG TTAGTCCTCT GCAGAACCCT 414 60 

CTTGCCTTTC AGCCACCAGC CAGCCTCACA GGTCTGCACA CGGTACCTTC CAGAGCTTCC 4152 0 

CAGTGATACA AAGCCATCTT CCCAGGTCAT CCTGGTATAT TTGAGTTATT GGAACAACTG 415 8 0 

TTTGTCCACA GACCCTATCC ATGCCCACAT ACCACTTAGC GGCCTCTCTG TCCAGTACTT 4164 0 

ATCAGGAGAC TGGCAGGGCA GCCATAGGCC TCTCTCTGTA CAAGCCTGAC CACTGGGAAG 417 0 0 
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GAATGGAGCA TCTGGGTAGG GACTCCCAGG CTGCACTTAC TTTTAAGlJCA JrTf CA*GC£y£G * .4.1 7*6 5" 

TCTATGGGAA GCCTCAGTGC CAATGCCCTT TGGAGCCAAC TCCCCTTCTT TAGGGCCTGG 418 2 0 

CCTGTGTCTG GGCTCTACAC ACATGGGGTA ATGCTAGATG ACTCAAGACA TTCAATAGGA 418 8 0 

AGAGGGCTCC AAGACAGCTG CAGCATCAGA ACTGAGCAGC CACGTCTGGG ACTATGGCAG 4194 0 

GGGATCGAAG TGTACCTTTC CCTGTGTACC AGCCTAGGCG GGGGGAGCAA GGGATTCTGG 42 0 00 

ACCAAGTCCC ATGTTTAATT AATTCATCCC TCTGTCTACT TGATTCTTCT CCTCTTCCTT 4 2 060 

CCCCCTGAGC AAG CTGATG A AATATTTCCC AGCAGCCCCT GACAACTTCA AACCAACATC 4 212 0 

AGCACTTGCC AGCACTTTTG AAATGGCACT TTCTGTCTGT GCTTAGAGCT ATTGCCAGTT 42180 

CTGCAGACTA ACTGCAGTGT TACCTAAGAG CCACTCCTGA CAGAGGGTGA GCACCTCTAG 42 2 40 

GCCTCCCGCA AATACAGACG CTACCAGGTC AAAACAAAGA ATGATTTTCT TGTTCCTTGT 423 00 

AAAGCCCCAG GTTTGGAGAA AGAGAAGCTG AATCAACTCA GAGATAGGAA GGGCTTGCAG 42 3 60 

AGCTGGAGGC AGCAGAGCCA TAGAAGTGCC AAAAGTGACC TCATGGGAAC AGTTGGAGCT 4 2420 

GGAGCATACA TGTGGAGTCA GCCACTCACA GTGCAGGGGT GGGCTTCTGT GACCCTCACA 424 80 

GCAGGTGGGG TTTGGTATCT CCATGACACC AACACTCCTG C TT C C AAG AC TGAGCTCTGA 4 2 540 

GATGATGTCT CCCCACTGTC TAC C AC AC AG AGGGGTAGCC TTGGCTCGTC CTGTTCCTGT 42 600 

TACCTAGCAT GAGACACCAA CAGCAGCAAC CAGAGTATGC TGGGTGCTAA AATACAGTGT 42 6 60 

TTGATTCCAC TTGGTTCCCC TAACAGAAGG TAAGAAACCA TACATGTTCT TACTTCACAG 4272 0 

AAAGAAGAAC CTGTGATCTG AGAGATGCCC TTCCCAAGGT TGTATTTAAG AAGCAGACAA 4 2780 

GCTTCTTCCA GGGTGCTGCT TCCTCTATGA GGTGCATAGC AGACTTGGGC CCAGCCTGTG 42 840 

GGTCTACAGA GATCTGATGC CAAGTTGCCT AGGAATCTGG GACAGGGAAG TCAGCAGGAC 42 90 0 

TAGGGTTGCT GCTGCCCCAT CAGGGTTTAT AGTACCTTTA TGTATTGTGT GCGGCACCTT 42 960 

CATAGTCGCT GTCTATATAC ATGTAATCTG TATGTCCAAG ATATTTATTA GGGGGGCTAA 43 02 0 

CTCAGCATCA TTTCTCAATG AAGTTTCTTA CCAGAGGTTT CCCATACTGA CAAGCTTGTA 43080 

CTTGGCTGTT CAGACACTGT TTCCCTTCTC AGGCCAGAAC TGTTTAAAGC AAGCAAACAT 4 314 0 

GAAAGCCAGA AAAATGAGCT GATTGTGTGC TAACCACAGA CCCTTTGGTA CATGCATGTA 432 00 

CATGTTCCAG CATGCAGAAT GACACAGGCA TTATACTGTT TTCTTCTGTG GCGTACACTA 4 3260 

GAAAAAAATG TATACAGTAA ACTCACTTTG TAAAACTTAC TTTGAAACCA TTATGTGCAG 43320 

AGAGAAAAGC TACAGACCCT AAGTGTGTAT AGTTCAAGGC CATGGTCTCC AAGTCATTGT 43 3 80 

TCTATTGCTG TGCAGAGACA CCATGACTAA GGCAACTCTT A C AAAAG AG C ATGTTACTGG 434 4 0 
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GCAGGCAGGC ATGGCACAGA AGCAGTGGCT GAGAGCTACA TCTTGATCCA TGGGCAGCAG 43 560 

GCAGCGAGAG ATGGGGGAGG AGAGAGAGAG AGACAGAGAC AGAGAGACAG AGAAAAAGAA 4 3 620 

AAACAGAGAG AG AG AT T AAT ATTGATTGAT TGATTGATTC TGGACCTGGT GTGGGCTTTT 43 680 

GAGATCTCAA AGTCCATCCT CAGAGACATG CTGACCTAAC TCACAAAGCC ACACCTCCTG 4 374 0 

ATCTTACCAA AC AGTT CAT C AGCTGGGGAC TAAACATGCA AACATGTTTA TGGGGGCCAT 43800 

TTTCAGTCAA CCCCCCACCC ACAGCAGTAT TAGAAAATGA ACTTAGCTGA GTGGATCCCA 43 8 60 

TAAGCCTGTA GAATAGCACT TAGGAGGTAG AAGCAGGAGG ATCAAAAGTT AGGGTCATCC 4 3 920 

TTAGCTACAT ATTGAGTTTG AGACCAGCCT AGACTTCAGG AGATACTCTT XCTXTXXTTT 4 3 980 

TTTTTTTAAT TTATTTATTT ATTATATGTA AGTACACTGT AGCTGTCTTC AGACACTCCA 4 4 040 

GAAGAGGGCG TCAGATCTTG TTACTGATGG TTGTGAG CCA CCATGTGGTT GCTGGGATTT 4 410 0 

GAACTCCGGA CCTTCGGAAG AGCAGTCGGG TGCTCTTACC CACTGAGCCA TCTCACCAGC 4 416 0 

CCGAGATACT CTTTCAAAAA GAAAAAAAGA AAAAGAAAAT GAACCCAAAC ACACTCAGGT 442 2 0 

CAGGAAATAG ACTATTAGAG CCCCCTAAAC ACACACATAC TCCATCCATC CCCCATTCAG 442 80 

AACCTTCTTC ACATCTCCAA AAAAATGGAA CCATTCCACA AGTCTTAGTT TTTCTCTGAG 44340 

TGTTACATTT GGGAGAATCC ATTGTTGTAT ATGATTGTGT CCCTTTGTTT TCATTGCTAC 444 00 

AGAATTTTCC TTTGAAAAGC TGAAGATATA GGACAGTGAT AGAGCACTTG CCTGGCATGC 44 4 60 

ACAAGGCCCC AAGTTGGGTC TCTAACAGAG CGATAAAATA AAATATTTTG AGAAACTACA 44 52 0 

GGAAATTTTT AAGAAAATAC TTATATCAGT TCATTGAGAA TTT CAT AT AC TATATTTTGA 44 5 80 

TCATATTCAC CCCCAGTTCC TCTTTCTAAC TTCCCCACCT CCCTACTTCC CCCATCTTCT 44 64 0 

TGT CATC ATT GTTTTCTCCC CCCTCCCCCC CTCCCCCTCC ACCTCCTCTT CCCCCTCCTC 44 7 00 

CTCATTCCCT TCCTTCCTCC TCCTCCTCCT CCTCTTTCAT AATGTATTGA CTCTAATTTG 44 7 60 

TTCTGTCCAT ATACTTCTGG GTGCAAATTG ACTTACCAAG AGCTACACCC CTAAATACAA 44 8 20 

CTGATTTCAT TTCTATCCCA GAAGCTCTCA ACTGTTCATA GGTCCTCAGC TAAGGGTGAA 44 8 80 

GGCTCATAAA CTCTGCCCCA GTCCATGACA GAGTACTGCC TAGGCTTGAT CTTGTGCAGG 44 94 0 

TCTTATGCAG GTGAGATGGC TGCTGTGAGA CCGTGCGTGC ATGTCCCTGT CATGCCCAAG 450 00 

ATCCTGCTTC ACCCCTTGAA TTCTGGGTTC CCTGACCTCC AACTCTCTCT AAGATAGTAC 450 60 

CTGAGCTTTA GAGGTGGGCT TGATATGTAT GCCCCACTTG TGGCTGGGCA CTCCAGCGAT 4 512 0 

CACCGTCCAC TGCACACAAG AAGTTTCCCG ATGAGCTCTA AGAGCTGTAC TAACTTACGG 4 5180 
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ATACAAAGGC AC AG AT TT AG AGGGCAGTTA GGCTGTGTCC TTTTAGCJgAA JATAATTAACST • > 4 3J?J» ^ 

TGGCCAAATT TACAGAACCA GATATGTGCT GCCTCCGGTG GAATGGGCTT AAGTTCAGCC 4 53 00 

AGTAAGTGAC TGGCTACCTC ATAACATTTG TGGCACTACT GCACCATGGG CATAGCTTAC 4 53 60 

CACCCTGGTC ACTACTGCAG CTCACGGGGC TCACAGCTTC CTTTCTCTGA TATCCACACT 4 5420 

ATTGAGGACT ATTGAATATT ATTGAAGATT TTCCCCACAG CAGCCTGCAG AGTATCTTTG 4 5480 

AGTATGGTGA AGGTTAAACA GCAGGGAGGA AGCTTCTTAG TACCAACTTG ATTTCTCCAT 4 5 540 

GTCCTGTGAT GGGCATGTGT GGGTAAGCAA TAGGGTCTTA TCATCATGTT CTGGTAGGCA 4 560 0 

ACCAAGCTAT GAAAGGCTTT TAGAGCTGGG TATAATGTAG TTCCAGCATT TAAGAAGTGG 4 5660 

ATCAAGAGTT TAAGGTCACC CTTGGCTACA TCATGAAATT GAAGCCATCT TG AG CTACTC 4 5 720 

AAACCCTTGT CTCAAAAGCA AAACCTGATC ATCTATTCTG CATTAATCTA ATCAGCGTTC 4 578 0 

TGATTGTTTC TGCGGTCAAG TTATTACAGA TAAATTTGTT TATGCTTTTG TGTGCACATG 4 584 0 

CATATATTCT GCTTCAGTGT AGACCTAGGA GTAAAACTGT TCATCCTACA CAATTGTATT 4 5 900 

TAGCAAGTAG CAAGAGTTCA GGCCTTTTCT AACTTTCTGC CTGATTTTCC AGTTTTTCTC 4 5 960 

CTCATTGTGT TTTTCTGCCT ATTCAGGATA TGAATCCTTT GTTGACTGTA T AT ATTG C AC 4 6 020 

ATATCAGCCT AGAGTCAGAC AGTAATGACT AGAGAACAAA GCAACGCCTA AGGCACTGCA 460 8 0 

GTTCTTTCCT GGAGGAATAG AAGTTAACAG CACCACTTTC TGGTTCCTGG TCTCTGGCCA 4614 0 

GCCAGGGAAT CCCTAAAGCT TTGATTCTGT TGATTGTCAC TTTGCTCTAA GATTATGACT 4 6200 

AAGGAATTGA GCTTCTAGAA TCAGTGACCA GAGTTCTCCA GATTTGGGAT AG C C AC AG AT 4 6260 

AGAATCATCA ATGAACTGTT CTTTTTTTCT TTTCTTTTCT TTTCTCTTCT TTTCTCTTCT 4 632 0 

TTTCTTTTCT TTTTTTTTTA AT C AAAAGTG TCTTTTAGGG ACCTAACTTT ATGGATGACT 4 6380 ; 

CTTCAGCCCT TTCCACTCAT TCCCTGTGTG GTGTCATACC TCTCAGGGAA ACCAATCAGG 4 644 0 

AGAGTTGAAT TCTGGACCCC ACTTAATCAT TACAAGAGAT AGTAAGGAAA TTCTTAATGC 4650 0 

AT AT AC C AAA TGAACATGCT AAAGAAACTG GTGATTCTGC AGTTATGCAT GGATTCAGAA 4 65 60 

ATCTGTAAGC CCCCAGAGCC CAGAACATTT AATGTTTTGG AGTTCTGTGA TTGAATACTG 4 6 620 

AGGATGCAAC CCCCAAGATT ACAAAGGTCT CCCTAGAGGA GAACTGTTAA CAAACCACAC 4 6680 

CAGTATGTTT GACATTTGCT CCTTTCTCCA GTAGGCCCTT CCTCCAATGC CCTATGGTGC 4 674 0 

TCTCATCTGC CCCATATGAT ATCTTCCTTT CTCTGATATC CATTGCCAAA ATGCTTTGTA 4 6800 

GCACATGGTG ACATGCTCTC ACCACGTGGG GAAGGGGTTA ATGGTAATCA GCATCTTTAC 4 68 60 

TGTCTCTGAA TCTATAGTGG TATACACAGC TATACTGTTC TCTCAATTTC CTGGCCTGAC 4 692 0 
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CAAGTTGCTT CCTTTGCCTT CTCTGGGTAC CTGTGCCAGG CACACArCTS TGOCGOGTAT 4 6 9*0 

ACAGACACAC ATCTGTAACC CAGAGGTGCT CCAGAACCAA CCTCTACAAG C AC AT AG T C A 4 7 040 

TCCGGTAGCC TTCAAACCCA AGGTGGCTTG TTCCTCTCTA AGACTTCAAG AAATCCTAGA 47100 

GAAGCTGTGA TCTTTGGGCC TGTACCCCAT TGAATGAATA GGCCACACAT TGCTGTCCAG 4 7160 

TAGACAGTGA GCCACAGCCT CTCTCTACCA GTATGCTGGA CCAGACACTA GGCACATTCA 4 7 220 

CAAAGTGAGA GTGTCAAGTG TGTCTGCTCT AATCACCCAC CCCAGGCATC AGAGGCTTGT 47 2 80 

GACACTCACA GGTTAGCCCT CCAGGAAGCA GGCCACAGGA CTTCAGGTTG AGCCTGGAGA 47340 

AAGGTGCCCA TGGCCGTCAC CTCCAGCAGC TACTTGGCAG GTAACCAGAA CATGCTTGGC 47 4 00 

TCACTCAGCT CTTGGCTGTG CTCCCCAGAG GGAAGTGTTT CTAATCTGTC GTCACTGCTG 47 4 60 

CTCCCATATA CTCTGAGGCA TTGTGGCTTT TTCTTGGTGG TTGGGCAGGA AGCCTCCAGA 47 52 0 

GCCTAAAGGA ATTGCCATGC TTGATGACAG ACAAAGGCTA TTGATGGCTA TAAATCACTT 47 5 80 

AGCTGCTGCC TGGCTTATTT AAGAGGAAGA GGACATGTTA ACTATTCTGA GGATAGGCCT 4 7 640 

TCCTGTGGTG GGTACCCAAC TGAAAAGGGA TCTCACAGAT TGACTCCAGC TGTGCCCGCT 4 7700 

GAGTTAAGTG GAAGGAAATG CCCCACTTAG ACATGACTTT GCAAAGCCAA CCAGCAAATC 4 77 60 

ATCCCATTGA CTTGTAGCTC CACCTCACTG GGCATCCTCA AGTGACCCAC CTTAAGCAGT 47 82 0 

GTTGGGCCAG GATCCAAGGT GAGGAAGCCA GAGGCTGACT AGCTGGGACG GCACCACATT 478 80 

GAGTGGGGGC TGTTCTCAAG GAGGCAGATC TGGCTTAGCC CTGAATGTGG AGACTGTGCT 4 7 940 

ATCACCATCA TGTCCCTGAA GGCTGTCTAG AGCTCTCTGA TTCTGTAGTC ATGCCTCCCT 4 8 000 

TGGGGGAAGT GCTCCACTCA CCGACCGGGG CTTTTGTCTC CAAAGCTGAG ACATCTCCAT 4 8060 

CTATGTCCTT CTTGTTCCTT ATTTCTTCAC ATAAGACACT GTGACCACCT TCTCCTGGGT 4 812 0 

GTGTGACCTA GCTTCGTTAG AGCTGTTTAG AATTCGAGAA ATACAATTGT CTTGTAGTTT 4 818 0 

TCACTGGGAG AGGTCATAAC CTTTGCCCGT TAATGTATAT ATCCTCTTAA TGACATCAGC 4 8240 

TAGACAAAAC TAAGGTTTTA ATAACTGAGG ATTGTTCAAA ATATTTATGT TATGTAAAAA 4 83 00 

GTGTGTGGGT GTTTTTACAG TATGGAGATT GAACCTAAAA GTTCATACAT AGCAGGCAAG 4 83 60 

TGCTCCACGA GCTGTATCCT TAGCTATTTT TAATTCCTTA TTTTGAGACA AAGCTTTTCT 4 8420 

AAATTTCCCA AGCTGGCCTA GTTATCCTTG ACCTTGGGAT CCTCCTGTCT TAGTCTCCAA 4 8480 

GTAAGATTAC ATGACTGCTG TGCCATGCCC AGCTGAAAAT GTTTTCTACT GAGTCTCCTA 4 854 0 

CACTCTACAC AGCCATTTTC CCTACAGTGA GTGACCGCAG AGTCACAGGG TTTTCCCTTG 4 860 0 

ACTTTACTGA AGCCTTGCCC TGTGTGTCTT TGTCTCTGCC CTGATGACTA TCAGAGCAGT 4 8660 
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CCATAGGGAG AGAGGCAAAT GTTAGAATTC TCATCCCAGG TGAGAGAAGG TTATAGTTCT 
GAGCCAAGAC TACCCTGGGT GC AC CAT AC A GCAAAGTGCC TGTTCATGCA GACATGACAT 
GTTTCCCACA GCTGCCTTTG AGGACACCTC CTAGTTCTGC ACCATCTTCC CCTCTCTGAG 
ATTCTGTATG TTTGTGTTCT ACATCTGCCA ACTAAGCTAA ACTGACTCAA CTATTAGATG 
CATTTTCCTA CCCCATCCCA TCCTATACCA CCCAACTGCA CCTCATTTCC CCCATCCCAC 
CCCATCCCAT CCCACTCCTC CTCCCTCCCG CCAAATCCCA TCATGAAGTG CCTCCTTCCC 
TGGAGCCTAG CAGGTTGCCC ACCACTTTAT GCTAAATATG TGTCCTCTAT CCTTTAGTAT 
AACCAGACTA GTCAGGTGGT CACCATGTTT TGTGTAAGGA ATGCCATTCA TCACTGTTCT 
GCTCATGAAA CAGAATGCCC TTTTCACTCC CTCTGACTTT CTCAGTGAAT TTTCCAGTGC 
TGATGTCATC AAACTTGACT CCCAATTTTT AACAACCCTC AGTCTCAGAA CTACCAGTCC 
CCTGCTGAGT ACTTCAAGAG GCGGGTCTTG CCTCTGCCTG TGCAACTCAG TGGAATGTGA 
ATGCTTTTGA CTGTGAGGTA GAGAGTGCAT ATTAAGAGGC TTTGCAGATT TTCTGTAGAT 
TCTGGTTCCC AGTACTTAGA GCAGACCTGG GACCCAGCCA GGGGCTGCTG AGGAGTTTGT 
AGCACTGATG AAGTTCTGAA CAGTCCCTCC AGCAGAGCTA GCACACTGCG GATGCTCAGC 
AGACACCGGG TGCACGCCTC TCCTCGCAAG CATGGATTGC TTCCCCTGCA TCCTTAATCT 
TAGCATGATG CCTCCGTTTC TTCTAAAGCA CCAGGCGCCC GTCTCCTTCA CTTACTCTAG 
ATGGTTCTCA TGGTGGAGGT TAAGAATTCC CCATCTGAAC TCTAAACCAA ATACCTTATG 
AACTTCCAAG TTTTAGATTT TAG AG CATTT GAGATTTTAT GTTTGTATTC CAGAGCCTAT 
GCAAATATTC ACAAATCTGA AAATGAAATC TGAAGCACTT TTGGTCTCAG CATTTCAGAT 
AAGAGGTTAA CAGCCTGTAT GCTAATCATA TTTATGGAAT ACTTAGCAGT GTGTTGGCCC 
CTAAGATAAG AACTGATGAA ACATCTACAC CTTCCTGGAA TAACCTGAGA TTCCACAGAC 
CCTGTGGTGT TTGGAGCCC 
(2) ANGABEN ZU SEQ ID NO : 6: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 36901 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Doppelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Genom-DNA 
(iii) HYPOTHETISCH : NEIN 



43780 
48840 
48900 
48960 
49020 
49080 
49140 
49200 
49260 
49320 
49380 
49440 
49500 
49560 
49520 
49680 
49740 
49800 
49860 
49920 
49980 
49999 



(iv) ANTISENSE: NEIN 



(vi) URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS : Mus musculus 

(xi) SEQUEN2BESCHREIBXJNG: SEQ ID NO : 6: 

CATTCCTGTG CCCATTGAGT TACCAAGACC AGAAAACCAC TATTGCCATT GGGCTCTTGG 6 0 

GAAATAAAGG TTCCATTCAC ATAAGGATGC CCACTCCACA CCTACCACCA TCATTTTTGC 12 0 

AGTCCCTTCC TGTTCAGGCA AGCTCACCAT GGGAGCCAAG CCAGTGCTGT T C AG AT C C C A 180 

GTAGCAATAT CCACAGCCAG AGAGATGCAG AAGTCATATA GGCAAGAGCC TATATGCGGA 2 40 

C TGTT AC AT A CCAGACAGTT GTGTCCCCAC TGCTAAACCT AGAGAAATGT TCCACAAATG 3 00 

G C C C AG AT TQ CAAGAAGAAC CCTGGGAAAT TCTACCATGC ATCTCACAAA TTAGAAGACC 3 60 

AGTCATTGTG TGTATTGTAA GATCAATGTA AACCTCATGC CTTTGCTTGT CTAGCTAGAG 42 0 

CCAAGCACTG TGCAGTGCAT GGAAACAATA AAGGTCCAGA GAACCCACTG AGGGAGACAG 480 

GCATGGAAAG CAATATTTAT AACAAATACT TAGGGTGGGG CATGATGGGA GAAATGTCCT 5 40 

TGGGCTCAAT CAGCTCATGA TCAGATGAGC GGTGTGGTGG AAACACGAGG TGGGAGCAGC S00 

ACAGGTCACC CAGCTGTGGC CAGAAAGCAG CAAATGGCAA GAGGAAGGGG CCAGGAACAA 6 60 

GGTATAGACC CCAAGAATTC CCAGAACTCA GGCCCTGAAG TGCCCCTTCC TCCTAAATAC 720 

TCTGCCATCC TCCAAAACAG TGTCATCAGC AAGGGACCAG GCCTTTAACT CATGAACCTC 7 80 

GGGGGGGTGG GGGGGGCGGC ATTTCATGTT CACACCATAG GGGTGACAAA GGAGTTAGGA 84 0 

GCCAGGCTCC CAGGATGCCC AGCCTGGGAA GGAAAGTACA TGCACTGCTT CTCTCAGCTG 9 00 

GGGCCTCATT GGACAGGCAA GTGCCCTGTG AG C AGGTGT C AGGTAGGAGC CTGTATTTTG 9 60 

ACATGGAGAG GACAAGGCAG GTGCCTGGGT GCTGCCAGGT GGAAAGGGCA AACGGCCTGT 10 2 0 

GTGTGTGTCT GGTGCAGTCC AGGCACGTGC AGGGGAAGCC CAGAACTCGC TGGATGGGAA 10 80 

CACACCCATC TAAAGC AC TC TGAACCCAGT TCATAAAACC ATGGGTCAAT ATTTTCAAAG 114 0 

TCACAGAACT AATGAGCTCT GCCAGACTCA AC AG AC C G C A TCCCAGTGGG TGATAAGACA 12 0 0 

AGTGTTAGCA CAGAGGAAAC GGCCCAGGCG GGAAGAGGCT TTTCTTAATC TGTTGGGTTT 12 60 

CGTGTTTATA GTAAAGCAGC TGCCCTTGGA CAAGAGTATT C ATTT AT C AG GTCACCCACA 13 2 0 

AAGGAGGCTT AGTTACTATG CTCACCCTGT TTGGGTTTAA GTAATAACTG TCTACAGACA 13 8 0 

AGTAAAAATT GGATCAGGGC AAGTTCAGTA GGTCCCATCA GGCCTGCAGA AGCTGTCTCA 14 40 

GGCTCTGACT GCCAAGTTCG TGTGCCTGTT GTCCAGCAGG AATAGGCAGA GAGAAAGCTG 15 00 
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TGGAAACCCT AGCCTAGCCC CGAAGAGCTC TATTTTCACC CTTTAAAAAT GTGTGTTGTC 15 60 

TTCCACTCAG TATTTCTGTG AAACAGCAGC AAAGAATGAT TCTAGTGTGC TCATTTAGTC 162 0 

CCTGAACAGT TCATCAGCAT CCCACTTGTC TCTGGGATTC CCAAGACCAT TCAGGCCTAG 168 0 

ATTCCCCCCA CACCTTCCTT CCCACGGCTT GGGGTCTGCA GAGGAAAGTG GGCAGAGGAA 174 0 

GGGGAAGAGC CAGCTCACAT TGGTAAGGCC TTACCAACCA GGAAAAATAA GGATGGCAGT 1800 

GACCCAGCTA AGCATCCTGA GTACTACAGA GGAGGCTTTG TGAGGGAGGC CTCACTTCCA 1860 

ACAGAGATTC TGTCACCTCC TGAGTCCTGG ACTAAGGTAC CCAGAGTCAC CTTCTCACTC 192 0 

CCGCTAGCTT CTGTGGGTTC AGTGACACAG ATCAGGACCC AGGCTGTACC TGGAAGCGTC 198 0 

AGTCTCACGA GAGGTCTTAT CTTACTCATT CTCTGTTGTC TTGAGGTAAA AACAGCATGT 2 04 0 

GCAGAACTGT AAGGTGCTGC TGGTCTTTGT AAATAAAGAA ATAATCTCTG ATGAAAAGTA 2100 

TTTAAAGCAT GGAAGTGCAC ACCTATAATA CCCACACTCG GGAGGCAAAA ACAGAAACAT 2160 

TGCCATAGGC TTGAAGCTCA CCTGAGCTAT GTAGTGTAGC AAGTTCCAGA AGATC TGGAC 222 0 

TGTATGGTTA AGACTGTCAC CACCATCATC ATCATAATGA AT TGT AT ATT ATTATAATAA 22 80 

TATTAAAAAG TATTTAGTGG CTGCTTCCTA TGTCCTAGTC ACTGTTCAAG GGACTGGGAG 23 4 0 

GTAAGCTGTC TGAGCTCCCC AGGTTAGTGA CATTGAGCAG CTGTGACTGG CCCAAAAGAA 24 0 0 

TGCAGGGACA GGAAGAACAG GAAAAAAATC ACAAGTAGTC AGGTAGAGCC CCAAGCTAGG 24 6 0 

ACTGCAGTAG GCAGAGCAGG AGTGAGCAAG CTCACACGGG CACCACTAAG AGCTGATCCA 2 52 0 

ACCATGGTTT GTCCGTGACT GATGGCTTTG GAGCAAAGCA AGGATACAAG TAGAAGCCAC 2580 

ACTCCAACCT AAGAGTGTCT GGCTCCAGGA TGCCCTTCTC CTGAACCTTG GACTTCTGGT 2 64 0 

GAAAACTTAT GGATGGTGGA TCCCTAATGG TTTCCCAAGT GCTTGTCTTT CTAGGAAGCT 2 700 

TATTTTAAAC TCCACCCCCA TGCAAGGTCA GGCTATGGCT TACTCAGATA CAATCGTAAA 2760 

TGTCAGCAAA GCCATGGAGA AGATGAAGAA GTAAGAAGGA TCATCTCCCT TTTACCCTCC 2 82 0 

AAAGACTGAA GCCTGTGGAC AGGGCCCTGG GCAGTTCACC CAGGGGCTTG ACAACTTACA 2 880 

CAGCTCTGAC TACGTTCCTA TGCCAGATGC AGTCTGTCTG CTCCTCCCAT CTGTTCTGGT 2 940 

CTTCCCCAGA GCCTCAGACC AGCAGACAGA AATCAAGCCA TGCTTGGTTC TAGATCTGTT 3 000 

GCAGGTGCAG TGTGCATGGT GGGAAGGGGA ATGAGGCAGA GCAAGCAGCT TGAGTCACTC 3060 

ATGCCAGGGC TCCCTCCACT AATATCCCTC CCTAGAGATG GACTCAGGTT CCTTCCACAG 312 0 

CCTCTGCAGG CCTGGTCTTG TATTGCCCAG ACAGAGATCA CCTACTTCAG AAGGGGCACT 3180 

CAGTACTTGC AGTGTCCTCT TGATTGGATG GAACCAAACA ATGCTGGGAC ACAGGCCATC 32 40 




CCCCAGACCC ACAGGAGCAG CTCCACCATG 
ATAGGTAAGC TGATACACAA CCCTGCTTGG 
AAAAAAAAAA AAAAAAAAAA AAAAAAAGAG 
GTTCTTTAGG GAGCAGCATT TGGATTTCAT 
GAATAGCTTA TACCTCCTTC CCACTTAACA 
GCCAAAGCTG CAGGACTTGG TGGTGCCCCA 
CTAGTCGTCT TCTATAGCCT CTGAGACTCA 
TTTTTTTCCT GGGAAAGGAC TCATTGGGCT 
CACTCTCTTT TCTTCCCACC ATTAGTGGCC 
: GGCCCACCCC GCCCCCCCAG CAGCCCAAGC 

^^^^ TGAGCTCCCG GGTGACCTGG CTCCTCCTCT 
TGTATGTGTA TGAGAGGATC CGTGTGTTTA 
CCCAAATTCT AGCTTTCAAA CTAAAGTTGA 
TCC CTGAGTT TATCCAAGCT CTGTTCTTGG 
TGGGTGTAAG AGGGAGCCCT GGCCTTGGCT 
AGGCAGGCAG CAGCTCCCAG AGGGAATGTG 
ACCAGTGGTT CCAGTTTCAG TGGAACTAGA 
TGTGTACACA T C AT AAAAG A GCCAGCAAGG 
GCACAATGCC TGGTTCTGCT TAGGGGCCAG 
GCCTCTGTGT GCAGAGCTAA GCCTTGGGAA 
^ ACAAAGGGCT TTCAGTGCTG TCAAATGACT 
GCCACTGGGC CTCCCTTTGG CAGGGCCAGA 
ACTTCCTTTT GAACTAGAAA AACATGGCTC 
TGCTGAACCT ATAGAAAGGC CTGGAGTAGA 
TGGCCTCACC CACAAGGCCT GTTATGTCTG 
CATGCCTGTG AACTAGGCCC CATTCATTTC 
TGAGCAGGTT GCAGGGAGCC CAGGAGGAAA 
GGGGTGGCCC TGTGGTCAAG CCCTGGTGGG 
CCAGGCACCC CTTCCACTCC CCTGAAGCTT 




CAAA.TCTACC TCCAGCTTGA GG*TGGGCTGC *" 3 3*0 0 

TAAAGGAGAA GACAAAGTAA CATTCAATAC 3 3 60 

TTTGAGGGTC TAGACCAACT AAGGCTTGGA 3 4 2 0 

GTACCATCCC AGAGCAGGGT TCTCCAAAGA 3480 

CAGCCACCCA AGGCCAGAAA AC C TAG AG AA 3 54 0 

CCCAGATCTG GGCCCTGCCA CATTCTGGCT 3 60 0 

GTTTCCCACT GTGCACATTA AG AC C T AC AG 3 66 0 

AAATGACAAA GCACACAGAG AGCTTGGCTG 3 72 0 

TCACCACTCC AGGGTGGCCT TGGAAAATGG 3780 

AAAGCACACT TTGAATAAAG CAGAGCAGCC 3 84 0 

CCTCTCTCCT CTAGAGCTAT CTCTTGCAGT 3 90 0 

AAACACCCTT CTCCCTAGAA CATCTTCATA 3 96 0 

TCCCTCCCAA AGTGAGAGGT GACTTTGGCT 4 02 0 

TATAGGTCTT CAGGGTCAGC CTCCTCTACT 4 08 0 

AGGATCTGAG CAGGGCCAGA AAGCTGTTGC 414 0 

CTTCTGTGTG CCTTGGCCAC ACCTCCTCTA 4200 

GAAAGGCTCT CATGTGTGTG TGTGTGTGTG 4 2 60 

CCCAATTACC CTTCACTGCA ATGCTACACA 4 3 20 

AGCTGTTGCC CACGTGCAGG CCTGCCCCGT 4 3 80 

GAGCAAGGCT TCGTGGCTAG CTTTATGCTG 44 4 0 

GCAAGCAGTC CCTTCCCCCT CCCTACCACA 4 5 00 

GGGCTGCACT TGAACGCCTA GCCTCTGGAG 45 60 

AAACATGCTT CACTGCAGCA GGGCTCTGCC 4 62 0 

TTCAGTCCCA CAGACTAGAA AACCTGGCTC 46 80 

GCTCCAGAGG CCTGCTCCTC TGGGGTTTTC 4740 

CCTGCGGTTT CATGGGAACG TCCAAAATAT 4 8 00 

GGGGTCAGTG AAAGGCCCTA GCTGTGACGT 4 8 60 

CGCCTTGTCA GTCTGCTGCT GCCTCTCCTC 4 92 0 

GGCCTGCAGC AGCACTCCCC TTCCCCACCC 49 80 
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CCAGGCCTCT ACTTTCCAGC TCCCTAGCCA CCAGCCCCAC CCTGGCCTGG CCTCAGAGGG 5 04 0 

AACTGCAACA AGATCTCTAC AGTTCCCCAC CCCCAGCATC CCTCAATTTA GTACTGATCA 5100 

GACCACTGAC TTCCCATCAC GCCCCATTCC CTTGCAGTTT TCCACCACAC TACACTCAAT 5160 

TTGGGGCTGC TG AG AG AG C A GCAGGTCTCC TGTGAGGGTG GCTGCTGTCT TCCCACCTTG 52 2 0 

GGCTGCCCAG CTATAGAGGA GAGTCATGCT CTAGCACACA ACTC CTGTG A GAGCCCAGCA 5 2 80 

GCTGCCTTCA CAGCTACTGG GGAGCCCAAG GGCTCCTTAA GCCAACAGTG AGGATGTACC 5 34 0 

CATGTGGGGG AAATTTGGTT TGCCGAAGAA ATGAATTTGA AACTAGCTGG GAGCAATTCT 54 00 

TATCAAATTT CCATGTTAGC AGTTTTCACC AAGAACTAAT TGAACAATCT CTGTGAGTGG 54 60 

CCTAATTCCA TTAGCATGAG ATTCCCACAA AGTTAACAAG TGCCCTAGTG GCCAAGGGCA 5 52 0 

GAGAGGCTCT TCTGTCTCAC ACTTGGTTTT GGTCTTTGAA GATGGATGGA GTTTCAGGTT 55 80 

TCAGCAACAG CCAGGCAGAT GCTCACCTCT GGCCCAGTAG GCTTCAATCT CAGCAGCTCA 5 64 0 

GCTCCAGATC AACTTCAGAA GCCACTTTGC AAGTATTCAG GGTATGAAAG GGCTGATCAG 570 0 

ACCACTGACT TCCCATCCCA AGATGAATTT CTCTTCTGGG TTAGCAGGTA AAATGGATCT 5 7 60 

GAGGGTAGAA CATC CTAC AG ACCTCACCTC CCTTGCCAGG CAGTATTGAG AGACCAGGTA 5 82 0 

CAGAGGAGTA GAAAATATGA AGGCAAAGTC TGAGGAGCAT GAGTCTGGAC AGGGCCTGCC 5880 

CTCAGCACCA CCTCCCCACC TGAGGCAAGA CCCAAAGTTA GTGCCAGCAT CTCACTGTTG 5 94 0 

TCCAGAAACT GAGTTCTAGG GGCAGAAACA GCAGCCACCT GGGACCTGTT CCTGTCCTTG 6 00 0 

AGCCACAGCG AGGTAGCTGT TCCTAGTGGG TATAGTACTT TCTCTTCTCT CCACTGCCCA 60 SO 

GTGGGCTTGA CAGTTCCAGG GACGGTGCTC TGGGGTTACC CATCAGCCCT GTGGCATCAT 612 0 

GCTAGATGAG GAGCCCAGAG AATGAAGCAT CTAGCTTCTT TGTCCCTGAC TAGCTATAGA 6180 

CTGAGCAAGG GTCCTCTCTT CTTGACAGCT GCAGCATGGT GTCAGCATTG ACTGCTATGA 624 0 

ACCAGCCTTC CTATAGGTAG CATGGTCAGG ACAGAGGTTG CAGACCTACC TACAAGGCCC 63 00 

TTCCTTAACC TGCTCTACAA TGAGACATAA GCCAGTGACT CTTCCCTTCC CCTCCTCTGG 63 60 

GCCTGCTGGA TGGCTTCCTG CGGGCTCTCT CAGGGCATGA GCCCTTGCCT CCTAGAATAC 64 2 0 

CTTCGACTTG TCTAAAACTA GTCATAAGGC CCTGGCTCCT TCCTTCTGTC ACTGACTCAC 64 8 0 

CAAAACTCAA TGGAGCATTG CCTGCACTTG ACCTATCACC CCTTCCCTGT TTTTCTAAAC 654 0 

CAGATTCCCC AGCCCTACCA CCCTGGTGGT TTGCCTCAAC TTGCCAGCCT CAGGGGCCTT 6 6 00 

TTCTTACCCT TTCCTCTGCC TCTGCAGCAC TTCTCACAGG GCAGCCTGCT ACAGCTCCTC 6660 

CATGTCCCTC TGCCTTATTC TACCACCTCT ACCTTCTCTG TTCTGGCCTC CTGGGGGCCA 67 20 
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GTGCACACGC CTTCGTCACC TGGCTCGCTC AAGCCCTCCC TTAATTGTCT CATCCCTCAT 67 8 0 

CCGGTCCTAC TCTGTCCCCC AGCCCCAACT ATTCCCACAT ACTTATTTGA AACATCTTTC 6 84 0 

TTGCTCAGTA GCCTTCCAGC TCCTGAGTGG GGTCCAAGCC TGTACCCTCA ATTCCTTGCC 6 90 0 

TTTCCACCTC GAGCTTTGTG TTTCATTTCT GGTTCCTTGA CATCCCTTGA AATGAATCCT 6 960 

GCTTGTGAGT GTACCTCCCT GTGGATGGAT ATACCTGTGG GCGTCTTAGG AAGTATTTAG 7 02 0 

GCATTCTGAT TGCCTCTGAG GCCACTGGCC CCAAGAGCAC AGACTGATGC GTAGGGATAT 7 08 0 

AGGACTTGGA GCAGATCACT TCCCTATTTG CACATTAAGC TCCTGCCACC CAGAAAGATA 714 0 

AGAACATTGT AGGGCCATAG GAGAAGTGAT ACCCAGGGTG GAGTGAGGCC ACAGCTAGAA 72 00 

AAGATGAGTA AGAAATCCAA CAAAGGGATT CAAAGCTAGC TCTGAAAGCT GAGGCCTACC 7 2 60 

AGCCATTGCT AGTGTAAATA ACTCTGCTGC TGTGTATGAA GGAAGTAGTA CTCAGTAGAT 73 2 0 

AAGGAAGTAG TACTCAGGAG ATAAGGAAGT AGTACTCAGT AGATTGGTTA GGGCCTGTAG 73 8 0 

AG AAAAG AT C AGGAGACTTG GTGACCCCAA ATTATCAGCA TGCCTGGCAG TGAGTATTAG 74 4 0 

GAAGTTAGAA AC AC CTG AG A ACTAAACAGA AAGGACAATA GTGATAGAGG GACCCAACAG 75 0 0 

TCCTACCTCC TGAACTGGAG CCTGATGCCA TTGCTCCCAG GAGTCCTTCA CTCTGTGCAG 75 60 

GTTGTTGAAC ATCCACTCTG GGACTAGCAC ATATACCACT AGGGATGGAG ACGAGATACA 7 62 0 

ACCTAGGACC GAGAGAGGCC ATCACAGTCA TGAAGGCCAG ATGCTATGAT GGGGACCAAG 7680 

AGGATGCTAA GAGAGAGTTC CTCATGCTAT CTTCCAAACT GAGTGATAGC CAAAGAAAGG 77 4 0 

ACATGAGCGA GGAGCAGCCC TAGTACT CTG GGCTGTGAGA AC AG T AT ATG AAAGGACAGA 78 0 0 

AGCCAAAAGG GCCTCAGGAC TTCAGTAGAG CCAAAGTAGG ATGGAGCAGG GAAGAAGAGT 78 60 

GATGCAGTCC AAACATACAT AAAACATACC ATATTGTTTA GCCAGGTAGA GGAACTGCTA 7 92 0 

GTCTTAAACA GTGGTTC CTG CTGGAAGGGA CATGACCCTG TTTTGTGTGA AGGCAACACA 798 0 

GTAGCAGGAG ATGACGACCT GGACAACAGT GATGACAGGA AGGAAAGCAA GAGATGCTTC 8 04 0 

TGGAAATCTA CTCCAGATCC TAGAACTGGA CCATTTGAGC AACTCTTGCA TACCCTGTTG 810 0 

CTCTTTAAAA AGAGGAAGAA AGAAAAGAAA AAAGGAAAGG AAAGGAAAGG AAAGGAAAGG 816 0 

AAAGGAAAGG AAAGGAAAGG AAAGGAAAGG AAAGGAAAGG AAAGGAAAGG AAAGGAAAGG 8 22 0 

AAGAAAGGAA GAAAGGAAGA AAGGAAGAAA TGGAAAGGGA AGGAGGGGAG GGGAAGGGAG 82 80 

GGGAGGGGAG GGGAAGGGAA GGGAAGAGAA GAGAAGAGAA AAGGAGAAGA AGAGAAAGAG 8 34 0 

AAGAAGAGGA GAGAAGAGGA GAGGAAAGGA AAGAAAAAAA GCAATAACAG GACAGGTGCC 84 0 0 

CAGACAAGAG GAGGTCTAGC TAGGCTAGGG TAGACACACT GTAGTCTGAG TGGTACTTAT 8460 
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TTATGGCCAG GAACTTGGTC GCTGATTTTC ACTTGGTTGG CATGCCTGCC TTCCTCAGAG ^ 85 2 0 

GCTTCTCACC TAACCACTGT CTGACCTGTC AGGATGCTGA GGTTATGTAG ACTGAAAGAC 85 8 0 

CCTACATAGA GAAAGACACA ATCTCAAAAA ATTAGGTAAA TAGCAAATAA TAACCACATT 864 0 

TGGACACAAG TAAATAAACA TGGCCCAGTC TGGGTCCTCG GATGGTAGGT GCAGTGTCCA 87 0 0 

GCAGCATAAG TTGTGTTGAG CATACTCACT TCCTAAGGTA AAGAATGCCT ATAATAGTAA 8 7 60 

TAAATTGACA GCAGTGTAAA TTTGTATCTG AACCTTTCCC TTTAAGTGGT ATCAGTACCG 8 820 

TTCTGGGCGG AAGCTTCCTT TCTTATGACA TGGAATGTGC ATCTCTGGTG TGCACTTATA 8 8 80 

TATAGGTTGA TTATGGCTTG CCAGGACATG AAACCCTGGC TCAGCTGGTC CCTGGGATGA 8 94 0 

GAAACAGCAA ACCTTCCCCC TCTTTCCCCA GGCCTTGCAG GCCCAGACAG CAGGTAGGGA 90 00 

CTGCTTGAGA GAGGGCTGCA GAGCTTTCAC CGTGATGTCC TGGCTGACAG CCTCCTGTCA 90 60 

CAGAAGAGTC CTACCCAAGA CCTCCAGAGT TGTGGGGCCC CAGTGGCTCA GGCCTCCAGA 912 0 

TGCTCAGCAG ATGCCAGACC TGGGACTGAG GCCCCATCTC TGAGGGCTTG GCTTGCTGTT 9180 

CTGGAAGGTG ATCCTGGCTG TCAGCCATTC TTGAGCCCCT ATTTAGAGCA GTTGTCAGGC 92 4 0 

AGTTGCTGGG ATTCAGCTAG CTCCCCATCC CCAGCAGGGC TGAGTGATCT CATGCCTATG 93 00 

CGATGCTGTC GCCTGGGGAG GAGGTGCCCT AAGACTGAAG GCAGGTGCCC AGACCAGAAG 93 6 0 

GAGAGTCTAG GCCATGGCAA CCCAGACAAC CCTCAGCCAC TTTCCCAGTT CCATACCCTA 94 2 0 

ATGTGCTCCA GCCTGGTTCA TTTGCCCTGG GATAGCACAA GGCATCATTT GAGTTTGGCT 94 8 0 

G C AAACTTT A TGTGAAGTTT GCCCCTTTCC CCACAAGAGA GGAAAGCTCA GATTGATAAG 9 54 0 

CTCGCTTGCC AGAGACCCCA CAGCCAACCG GTTTGCACAG AACCCTCAGC CCAAAAGGCA 9600 

GCTTTAG CTA ACGAAACAGC AACTGGCACT CCAGGGACCC CTGGACTTTG GGCCACAATT 96 6 0 

TGTAAACTCT CGAGCTATTC TTCCCAGAAA GTTCTTGGGT TCTAAGTGGC TTTTGCCACG 9 72 0 

TCCCAGGACT GGAACAGAAG AGTCTGGTGG CCCCCTGCTG ATCACTGTGA GAACTGCACA 97 80 

AGGGTAGACA GGTGCCAGCA AGAGGGGCCT TGGCTAGCCC CAGGTGAGAG GAGAGATCTG 9 84 0 

TGCACCCCTC CATGGGTGAT TGGCCCCACA GGGAATCTTA AGTTCAGTGG AGCTCTGGCT 9 900 

GCTGCTGGTT TGGCCATGTC TCAGCCTGTC AGTTCTAGAT CTTCTAGATC CTGGGCCTCC 99 60 

TGGGAGTCTG GGAGCTCCTG GGCCAGAGTA TCGCTGGGTC CTTTGTGATG TGCACATGCT 10 02 0 

TGCTCCTTCC CCTTCCACTT GCAGGATGAG AGGATTTTAA GATCATTTCC TCAAACCACC 10 0 80 

CTAGGACACT AACGAGCCTT ATCCGCACCC AGAAGTGGGA ACTTTGTTCC GTGCATCCTC 1014 0 

TTGGTTGGTG ACAGGATTTA AGTTAATGCT TTGCTCTTGA CAGACTGTTG TGAAGAATTC 102 00 




CTAGGCTGAT GTCTTAACTC AGAGGGAGAG 
CAGAATGGAC AGATGGACAA GGGCTACTAA 
CTGAACAAGG CCAGCCTATG C AAC C AG AG T 
CTCTTCTTTT CTCAAGGTCT TGGGCAGCTT 
AATTGTCAGG TCATGGTCAC TGGAGAAGCT 
CCATAGTGGC CCCTCCTTCA CCCCATCTCT 
AGCAGAAGAG TTCCTGTGGA CCAGGACTCT 
GCTTGGAGCA TGGAGAAGGG TCCCTGTCCT 
CTAACAGCCT TATCCTCACA GTCCTGCTGT 
TACAAACTGC AGT CCTAGTT CAGCCTTGGG 
GGATTCTGAG ACTGCACAAA G AG AAC AGG T 
GTCAGAGCAT TTATTTAACA GTCTGAGCAG 
TGTGACAAGG TGAAGGATTA TCAGATGTGT 
GAAAGCACCA CTGTGTCTTG GACAGTTGAT 
TGTTCCCTCT GCCTTTGCAC CAGCCCTGTG 
AGGAAGAACA GGAGATTCAC CAGGGGTTCC 
AACTGTCTCA GAGGCTTGGT GGTCAGTGAT 
GGGATTGGGG ACTGAGATAA GGGTGTCAGC 
AACACAAAGG CTTTTCTTCT TGAGCTGAGT 
CAGAGGCCCC CATGACTGGA GCTAGGCTTG 
ACAGGTCCCC ATGACAGGAG CCAGGTGTGT 
CCTTGTAGAG AAAGCTCTGC AAATAGGCAC 
GCAGGTCCAG TCTGGAGAAG GAACATTCTC 
GTCTAGATGA CAGATCTGAC CAAGCAACAC 
AGGTTTC CTC AGACACTGGC AGACTCTCAG 
CTCAACATGC AGCTTGGGGT GTCTCCTCGA 
TTCCCAGGGA GCAAGCTTTT T C C AC AC AGG 
CACACCTGAA AGACTTCATG TTCAATCCAC 
GGAGAACCTG CCTGCCCAGG ATTGAAATAC 
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AGGAAGCGAA GGGCAGATGG ACAGGGGGTG 10260 

TGGAAATAGG AATCACAGGC ACCAAGGTGC 103 2 0 

CATGCCAGAT TGTGATCAGA GTTAGACATG 103 80 

ACAGGGCTGT GCAGATGTCC ATGGAGGATA 10440 

GCTTGCCTGG AGTCTTCTCA TGCCTGTTTC 10 500 

CTTCTCCCAC CATGAACTCA TGTGGAACAA 10560 

GG AT CAT C C C ATCAAAGTCT CTGACTTATA 10 62 0 

GAGCCATTAG CCCACCCTGC TCCTGCCTGC 1068 0 

GGGGCCCTAC TGCCACCTGC CGGCTTCATT 1074 0 

ATTACAAGAG ACTGTGTACT CTGGTCAACA 10 800 

CTGGAAACAG TCCTGACTTC CCATAGCAGT 10 860 

GGACAGACAG CATCCCAGCA CTGTGGAGGT 10 92 0 

TAGTCATTTG TGTGGTGTAT GTGAAGAAAG 10 980 

ATTCCTGCTT GGTATCTGGC CC AG AAC AC A 1104 0 

ATCAGACATT AGCATTGTCT TACTTTGGGA 1110 0 

ACAACAAGAG TGTGGTAGAA CCAGCATTCA 11160 

GGTGATTGTC AGTACTGATA AGCACAAGAA 1122 0 

CTAAAAAGCT CTGCCTACAA ACTAGTGGGT 112 8 0 

CTAGTGAGTC CATGACAGAA GCCAAGTGTG 1134 0 

CCCAGGCCCC AATGACAGGA TCGGGTGTGC 114 0 0 

CCAGACCCCA CCTAGTGGGC TTCATGAGCC 114 6 0 

CTAGACAGAG CAGAGGCAAG CGTCTTCACA 1152 0 

CTATATGTCT GATTTTCCTT CTAAGAACTT 115 8 0 

TACTCAGCCT C C AGT AG AGG GATTTATCCC 1164 0 

AGCTGCCTCA GTGGGAGAAG AAGACTAAGG 1170 0 

AGCTGAACAA GGTCTCTAAT GGCTTTTGCC 117 60 

ACATGCTGAC TATAGTAGTA TCAGGATGTA 1182 0 

TTATTCACCA AGGGAGCCCC AAGGGTCAGG 118 8 0 

AGGTAACTAA CTTCAGGGCT GGTTGACTCT 11940 
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GTCTCCTGCT GTGCCTGGCT TCCTACCCTT GACACACTTC CTCCATCTTC CATCAGTCCC 12 00 0 

CACCTCTTCT CACTAGGGCC TTGACATATT TTCATCTTCC TATTTAGAGC TTTATCCCCA 12 06 0 

TGTACTTAGT TACTTATAGT AATTCTAATT ACACTGAAGT GAAGGAAAAT AGAATGATAG 1212 0 

CTCTTCTTAC AAGTGAGCCC CAGAGGAAGC CCAGCAGGTC TTCTTACCAG AGATCATTAC 1218 0 

TGTGTATCAT CTCTGGACCA GGCATGACCT GAGAGCATCC CCATTTAGTG AGAAATGAGA 1224 0 

CAGGAGACCA CATACACATT CAGACCAAAA GAGAAAGTCA TTATTGACAG GTTGACTCTA 1230 0 

GGAAATCTGA GCATGGAGAT GAAAGAGAAA GAG C AG AAG A ACTAGTTTGA TCAGGTCACA 12 36 0 

GAAAGGTTCT TACACTGAGA ACTAAGGTAT TAGAGAATCA GCTGAGCCAA GGCCTTGGGA 124 2 0 

CAGGGGCAGT AGCACCTGTC TCCAGGATCC CTCTAGTTAC TGTCTATCCT CCACAGGCTT 124 8 0 

GTAGAGGAGT TCATGCTCCT GGCCAACATG GCGGTGGCCC AC AAG AT CTT CCGCACCTTC 1254 0 

CCTGAGCAGG CCCTGCTGCG CCGGCATCCC CCACCACAGA CGAAGATGCT CAGTGACCTG 12 60 0 

GTGGAGTTCT GTGACCAGAT GGGGCTGCCC ATGGATGTCA GCTCTGCAC-G GGCCCTAAAT 12 66 0 

GTGAGTGCTA GTGGGCAGGT AATGGGAAGA CCTGCTTGGA GAAAAGAGAT TAAAGCCTAG 12 72 0 

AAGTTGGGCT GGTGGTGACT TGTCTGCCTC CATGTAGCCA CTCCCTATGT AGCCAGGTCA 1278 0 

GTCTCCCCTG CGGTGGAGAA GATGGCATCC ACTAGGGGTA GGCTCTATTA TCAGGTCTGT 12 84 0 

ACCAAGGGAG ACTATTCAAG GTGTAGCCAC TTGCATGGCC TCTAGCAAGG ACTGGACTGG 12 90 0 

TCCTTGCTGA GCCAGGGTAA CAGGAAGCAA GGAATCTTTC TTAGAGGGAA GCACTTCACA 12960 

TGTTCCCTTC TCAGAGGTAA GCTTTATGAG GCTGCAGAAC CAGTGTCCTT GCTCATCCCA 13 02 0 

CCAAAAGGAG ATCTCCCACC CATGTTCCAA GATGGAGGTG GGTGTGAAGT AGGCAAAGGA 1308 0 

TTCCTCTAAT AAAGAGAGCT GGCCTATTGT AAGCATGGAA GATCTTAGGC CCATTGTATG 1314 0 

ACACAGACTA TGGATCACAG CTCTTACACC CTGCAGGTAG TCAACATGGC CCATAGCCTG 132 0 0 

GGAACCCCTC TCTACCTTCC CCAAAATGGG ATCAAGCCTG TTTCCAAGGC CAACCATATC 132 60 

TCATACAGGT TTCTGGGGTT TACTTCTAGA AAAGCCTGAC TAAGACATTT GGAGATGACA 133 2 0 

AGTACTCTCT GGCCCGGAAG GAGGTGCTCA CCAACATGTA CTCCCGGCCC ATGCAGGTAA 133 80 

GGAGGGGCCA CACCAGCCCC TGATCCCAGT AGTACCCATA GCTCTGGCTG GCAAGCACCA 13440 

CGTGTACATA GCCCACTACT GTCTTGCTCT GCTCTGGGAT CTACTGGATA GAGAGGCGCT 135 00 

GAGGAACACT ATCTGGCAAG AAAAGCTGCA GTCACACCTG GGACAGGCGC ACTGAGCTCC 13 5 60 

AGAAGAAATC TATCCTCTGT GCTGAAAAGC AGGCTCCATC CCTCAGGAGC TGTATGGCCT 13 62 0 

GTGGCTGCTA GAG AC C C C AG GCAAGAGAAA AGGTCTCCAT CTCTACTGTA GCTGCAGTCT 13 6 80 
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GCAGGAGAAT CAGTCTGCTT CGAGCTTGGG CCCATGTTCC CAAGCAAGTG ACAGCTAGGA 13 7 40 

GATAGATGGG CTGGCTCCTA GCAGGCTGTC ACAGCCCTCC AGCCTACACT GCAGTCTCTG 13 8 00 

CAGGGCCTAA GCATCCTTGG GATGGGAGCC ATCTCAGTAG ATTGGCAGGT CAATTGGAGC 13 8 60 

TACAGGTACT AATGGGGTCA GCTGTGGGCC CCAGCACTTG CCAGGGCAGT GGCAGGCCAT 13 920 

TTTTCAAGGG TCACTCTCAA CAGATTCAAT CTGTTCATGA GAGTCAGGTA GCCTCAGCCA 13 9 80 

GCCACAGCTG ATTTATTTCC TGATAACTCC TGGCTCTACT AGGAATGGAG CCATCAGGGC 14 0 40 

CGTTCGGGGA CTTGGCTGCC TGTTCCCCAC CCTACCACCT ACCCTAGACA GTGCACACAA 14100 

GACCCTAGGC TGTGCCCTGT GGAGTGCTGC TCCCACCAGG ATTCTGATGG CAAGGACTAA 14160 

GTGGCAAGTG ACAGGGACAG GTCAGGGCAC AGCAACAGCA GCACAACAGT GGGGAGTGAG 142 2 0 

GCCTGGTTCC CAAGAGAGCT GCTGAAACAG GACACAAGCT GTCCCAGTGG TCTCTGGCCA 142 80 

CTACAGAGAA GCCATGATTG TTGCCCTGCC C AG AG AT AG C TACACTGACC AAGGAGGAGC 143 40 

CTTGACCTCT TTTCCTCCTC ACGCTGCCTT TCTGAGGAAC TGAGCCACCA CTGAAAACAA 14 4 00 

AGATAAACAT GACTTACTAT GAAGACTATG CCCTCTGTCC CCAGCAACTT GCCCCAGATG 144 60 

TAGCTCAAGA TCCAGCAGGG GGCTGTGCTC TGAGTTCTAG GGCTATGTAC ATGGAGTAAC 14 5 20 

CAGAAAAGGA TGTCATTTGG CCAGGGATTC TGGAGCTTTC AAAGAAGTGA ACATCCTTCT 145 80 

AGGCAACAGC TGCTGATTCC AAGGCTGTGA TGGCTGAAGC CAGACCTCAT CTAGGTTGTT 14 64 0 

CCTAGGTTGC AGCGGCTCAG TGGTTCCTTT GGCTCAGGTC TCTTAGACCT GTGGATCACC 147 0 0 

GTGGACAGTT GTTCAGGAGC AAACTGATGC AGGCTGGCAA GCTAACAAAC TACCCTCTTG 14760 

ACTGGCATAT GCTAGAGTAT TGTACTGTAC TTGTACTTGT GGCTAGTGTG ACCATCAACT 14 82 0 

GGGAAGAGAT C AG AG C C AG A GGAAATATGG TTGGCTCAGC CAGAAGCTGA GGAACCTTAC 1488 0 

GGGCTGCTCT CCCTTGGAGG TTGGCATCTT GGGCTGGCCA GGGACATGCG GCATCCTCAG 14 94 0 

TTTCTGCTTG TGTCTCCAGA AGACAATTCA CAGCCCTGGG CCAACATGGC CATATGTTTT 15 000 

CCTATCTGCA ATCATCTTGA CCCAGGGTGA CTGCTCGGAT CCTAAGGAAA ATTATTCCAC 15 060 

AGCAACTCCT CTGCATCATT CCTGGTAGGG ACTCAGCAAC CATAGGCCTT AAGGAGGAAG 1512 0 

AGCCCTTGCA CAGCTGCCCT GGTGGCTAGT CCCACAGTGC TAGAGGC CAC CCAGCATCCT 1518 0 

GAGGGCTTCC AGCCTCCCAT GCCCAACAGA GGCATAGCTT CCTGAGCTGT TGCGAGCATT 15 240 

GCCCTCATGA ATGGAGCCCG GCAGCCCTAG GCATGACTAG CATGCATCCT GAGCAGGGAA 153 00 

GGGCTCTGGT CATTACATGC TGTCCATGGC AGCTGCTGAG AACCCCTTAA GTAGGATGAC 153 60 

CCTGGCCCCA AG AATC TGGG GCTTTGATCA GCTGCCTGAA GCTGATAGGG GAGGTGTGTA 1542 0 
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TCAACCTTGC CATGGGCCAG GCTTGGGTCT CAGCACCTAG CCGACCCAGC CAGGCTTAGT 154 8 0 

CCCACTCTCC CTCCAGATGG CACTGTACTT CTGCTCTGGG ATGCTGCAGG ACCAGGAGCA 15540 

GTTCCGGCAT TATGCTCTCA ACGTTCCCCT CTACACACAC TTCACCTCTC CCATCCGCCG 1560 0 

CTTTGCTGAC GTCATAGTGC ACCGCCTCCT GGCTGCTGCT CTGGGTAAGG GACATGACTC 15660 

TGGCCTGGGA AGACCTTTGC TGGTCGAGAG TTACCCACTC TCAGAGTAAG TGACCACATT 157 2 0 

ACTGTTATCA TGGACATGCC GAGGGACAGA GAAGCCTAAG TCTGAACACT GTCGATCCAC 15 78 0 

ACCCAGATGA TGGAAGCTTT AGTGAGACTT ATTGCAAGCG CGGGACCATA TATGGTCCCA 15 84 0 

GAGCCTTGCC TCAGCACACA ACCGTCCTTA TCCCCATACT AGCAACCCTG GTCGCCCTCT 1590 0 

CCTCCAGGCT ACAGTGAACA GCCAGATGTG GAGCCTGATA CCCTACAGAA GCAAGCTGAC 15 96 0 

CACTGCAATG ACCGTCGCAT GGCTTCCAAA CGTGTGCAGG AGCTCAGCAT CGGCCTCTTC 1602 0 

TTCGCAGTTC TAGTAAAGGT GAGTGTCCAG CCTGGCCCCT TCTTCTTCCC CTTTCCCTGT 160 8 0 

CCTCCGATGA ATGGAGCACC AGTGCAGGTC CTCCCTGGGA GGATGCCACG ATGCATTGTT 1614 0 

CCTACAGGAG AGTGGCCCCC TGGAGTCCGA AGCCATGGTG ATGGGTGTCC TGAACCAAGC 162 00 

TTTCGACGTG CTGGTGCTGC GCTTTGGGGT GCAGAAGCGC ATCTACTGCA ATGTGAGTAT 16260 

CCCTGGTATG AATGGGAGGC CTGCACCTAC AGGCAAAACC AAACCCATTT TCCCGCCTGT 16320 

GTCTAGTTCC TTGTTGGGGA AATATTCCCC TGGTCCAGAA TATCCCATGA TAGTTTCACA 163 8 0 

GGTGTAAATG GTGGGATTCA ACTGAGCTCC CTTCTGTCCC TGGCCATTAG CTATGCAGGG 1644 0 

CCCACAGACT GCATCCTATA GCAGTGAGTT TCACTGGCAT GTGGCAAGAA AGGGTCCAGA 16500 

CCCCTGAACC CAAGTAGGCC TGCCCAGGAC AGGGCCTCAG GCCAAGGGTC AAGTCTGAAC 16560 

TCTTCCTTAA AAGCCCAGGC ACTCAGAACA TAACCAGGAT GGCAGGGTGT GGGACCTGTG 1662 0 

ATGTTCTTAT AGAAACATGC AGAAGGGGAG GCCAGAGGGT AGCCAGCACT GCTCTGGACA 16680 

CTGTGTCCCC AAACAGAAAC AAGAGGCCCA TCCTGCCTTG GCTTCTTCCC TGGATGACAG 1674 0 

TTTATTCAAA GTCCTCTTGG TGCCTTCTGT AATGTCACTT GGGGGGCTTT GCTTTAGCTG 16800 

CTCTGTGGTC ACCAAGTCAC CACCTGGCTC CTACCCCTGG CTTTGAACTT CTTACATACA 1S3 60 

CTTGGGGAAG TGTGGAACCC TGCACTGGAA GAGACACAGG ATTCATGAAA GAGGCAGAAC 16920 

AGGAAAGGGC CAAGTGCAGC TGGAACTACC AGACACCTGT AGTTACCTGG CTCTCAGCCT 16980 

GGTGGTCAGG TCTATCACCA ACAGCCTAGG CAGATCTCTT CTCTTTGCTA CAGTCACCAC 17 04 0 

CCTCCCACAT TGTCCCTTGG AATTGGGTCA CCTTCAGGTT CTACTTTGAC CAAAGGTGAC 1710 0 

TTAGCAGAAC CTCCTAAATC TGGCTGAGGT GGACCAAGGA TAGGGGGCTG GGGGATGTCT 17160 
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CTGTCCAAGC AGGCAGCTAC AGTAAGGCAG CCGGTACAAA GCTCCCTCCA GCCAGTCAGA 17 2 20 

AATAGGCAGG CAGGGCAGAA GAGGTGTCTG AAGCCCATAG CCTGAGGCTC CGGTGTGTCC 172 8 0 

CCCTGCCCCC AGGCACTGGC CCTGCGATCC TACAGCTTCC AG AAGGTGG G GAAGA a .GCCA 173 4 0 

GAGCTCACTC TTGTTTGGGA GCCTGATGAC CTTGAAGAGG AGCCAACACA GCAGGTCAGT 174 00 

CCCCTGCTGT GTCCCTAAGC CTACCTCTGT CTCAAACGTG TGCCCCTAGG TCCTCATCTG 174 60 

CCCTCATTTC TCCCCAGCAC CATAGGTTCC CCTGTGGGAT TCCACCAAGC CCTGGCTTAG 17520 

ACTGCCAGGT TCTATATGGG AACACCCACT ATGGCAGTGG TTCTCAACCT TCCTGATGCA 175 80 

GCGACCCTTA ACACAGTTCC TCATGCTGTG GTGACAC CCT TCCCCCAGCC ATTAAATTAT 17 6 40 

TTTCGTTGCT ACTTCATAAC TATAAGTTTG CTGCTGTTAT AAATCAAATG TAAATATTTT 177 00 

TGGAGATAGA GGCAAAGGGT CTCGAACGAC AGGTTGGGGA CTGCTGCTCT ATAGGTAGAT 17 7 60 

AGGTGCTATT CCTCTCCCCT GAACAGAACT TTTCAGAAAT TTTGAGAAGC TGATAAAAGC 178 2 0 

TTCTTTTATC CCTCTTGTTC CAAAGGCTGG CCCAGCCCAG CTCGGCCCGG CCCAGCCTGT 17 8 80 

TTTCTTGCTC CTCGTGAATG GTCACTGAAT AACAAATGTC TACATAGTGC CATTTAGCCT 17 940 

ACTGGTTTTC CCCAGACCCA ATGAATCCCA T TT AC AG AT A GGCGATAGAG GCTCGGGAAG 18 000 

TTAAGTGAGC CTCAGTGGTC AGTTGG CTTT GATTGCAGGC CCTCACCTGC CCTGTCCTCT 18 060 

CCTGTTCCTG GCTCTGCTAC AGGTCATCAC CATCTTCAGC CTGGTGGATG TGGTCCTGCA 1812 0 

GGCAGAGGCC ACAGCCCTCA AGTACAGTGC TATCCTGAAG CGACCAGGCC TGGAGAAGGC 18180 

GTCTGATGAG GAGCCTGAGG ACTGAATGCT AGCCCAAGCC AGGCCTGTGC CTGCCCTACC 18 24 0 

CTGCTGGCTT TTAGGAATAG GACCTTTTGA CACCAAAGGG GATTTTTAAT TTGGTTTTTA 18300 

ACAACTCAGG GGTTTGTTTT TATTTTTATT TTTC CTTTTA TTTTACTTTT GCAGCTCAGT 183 60 

TTTTAAATGA ACTGGAAGGT TAGGGGTCAG GGCAGGGGAT GCTGAGGCCT GGCCTGTGCT 18420 

TCCCTGAGCA GAGAGGATCC CAGTCCTCCT GGGCAGGCAG CCCCGCTTCT ACCAGGCGAC 184 8 0 

CCACTGCCCT TCCCTGCCCA GGAAATGGGG GGTTTCAGCA AATCAGTGTC ATGGAATAAA 185 4 0 

ATCAAGTGTG AATTGCTGTC TGTGTAGATG CCATGGGCAA GCATGGCAGC TGGGTGGCCT 186 00 

GTCACCGAGG GCAAGGGGCT CCCTAGAATC CACCTCACAG CTGAGCTGGG GTCATCAGCT 18660 

CAGGACCTTC CTGCCAGCTC C AGGGTG AT T CACGAGCCAT GTGTGGCAGA TTGATGCTGC 187 2 0 

AGCCTCCTTC TAGCTGATTA AAAATGTAAT TAGTATGCAC AGTAGGGAGC TGCCAGTCAC 187 80 

CCTGTGCATG TGGCTGTGGC CCTCCCTCCC CGCCCTTCCT CTCTGTTGCC AGCCCATGGG 1884 0 

ATGTGGGGAG GTGGGACTAC CACCTCTCTT CTTATATATC ATAGGCCAAA GCTCCCAGGA 18 900 



GCCCTGTTCA CAGCTATGCT ATGAGTAGGT 
CCTAAAAGGT AAAGGCAGAC CTTCCAGAGG 
ACCCAGCCAC CTGCTTAGCA TCCCAAGTAC 
AGCCTCTTCC CTAGGGAACT GGGCACAGTG 
GAATTGGCTT CAAAAGCAAC TAG AAT C TAG 
CCCCAGTGCT GTTCCCTGTG GCATCAGGAT 
TTTTCTTCAA AAAAGATTCT GTGGAGTCCC 
ACAGCTGCAA GGATATCACA GCCCTAGGAT 
GCCCCACCTG CCCTGGGCTC CTTGTCAGCC 
CCCCTTAGGT CTCCCTTCTG CTCCCATTCC 
TGATGGATGG TGGTTTAGTA TCTGGGTAAA 
CTCTAGACTA AAGGCTCATC CCACAAATCT 
ACCCGGGCTT CCAAGACCTC CTTTCACTGC 
TCGAGTACTG GGTTCTCTCA AGACACAGAG 
TGAGGAACAG CTTACCAGTC AGTAAGGAAA 
AGGCACTGGA CTAGAAACTT CTATAACAGG 
TACTGAGAAC TCTGAGCCAT AGCAGTCCTG 
TCTCAGGTCT CCATCTGAGG TGGTGCAGCC 
GTCCTCTGTT GCCTCCCAGT GGCTCTGTCA 
CTTTGTGTTT GTTCACCCAG CACTGAGTCA 
ACTCAGTGTG GCAGTTGGCA CCGAACACTA 
AATAAACGAA GTACTCACTC ATCAGCTATC 
CACAGGGCAC AGAGCAGCTC ACTGGCTTTT 
GAAGACAGAC ACAATCTCAC TCTGATTGGG 
TTCCCAGGGG AAAATGG AG C AGGTTGTGGG 
TTAATGGTTG TAACCTGCCC TCCTGGGGAG 
GCAAAGAGCC TTGGAAAGGA CTTCAGTGGG 
CACAGCACAC TGGAGGTATG GTAAGAGGGA 
ATACCGCAAC AGCCAGTGAG GATACCCACT 




ACCTCAATAC CTGCAGTTTC AAACATGTAC 13 960 

GCAGGAGGAC TTCAAAACAG ATCCTACCTG 1902 0 

TAGCAATTCC TACCCTTCTG AGCACTGGGC 190 8 0 

TATCCTCCTT TCACCAGACT GGAATAGTAT 1914 0 

GATGAAAACC AAAGCAACCA AGGCCCTGTT 19200 

T AAC AG AC C C ATCTGATATG GTTATGGTGA 192 6 0 

CTGGCAGGTT CCTTGCAGTG AGTGACTGGC 193 2 0 

GGGCTGTTGT CTGAGGAGAG CCACAGACAC 19380 

TCACACAGCC TTCAGCTGCC TGTCCTCCCA 19440 

CAGACCAGCA TATCTGGATA GGCAGAGCAG 19500 

GAAGACTCTG GTGCTTTGCC AATCCTGGAT 195 6 0 

GAGGAGGAGC TAGCTTCTCT GCTGGGCCAA 1962 0 

CTCCTTCAGA ATCCTTAAGG AAGCTGTGGC 19680 

GTGGCTGAGA CACGGCCTCC CCAACCCTCG 1974 0 

GTTTTTGCAG AGTGAACGTG CTTAGGAGGC 198 00 

CTTGCTCCAC CCTCAGGTTG GACATCATGT 198 60 

GGTTGCCCTA ACCTGTCTGA CAAATGGAAG 19920 

AGGCCGCCCT GGCCAGGACT TGAGCCACCT 19980 

TCTTCCCACA GCACCAG CTG AGTCACTTCT 2 004 0 

GAGAACTGAT AGAACGTGTG TCCACACACC 2 0100 

AGGGCACTGC TGGCAGAAGA GATGACAAGA 2 0160 

CAAGACACCT GCCTGCACTA TAGGCTAAAG 2 022 0 

CCTCAGTGGC CTGTCAGGTT CACATGGAAG 2 0280 

GTCTCAAAAA GCTCAGAAGC AGGCAGTATG 2 03 40 

TCCAGCATGG ATGAGAAAGT TAAGTATTAA 2 04 00 

AGAGGCTGAC ACCCTGCACA GTCCTACTTA 2 0460 

CCCAGGATGG CAGTCCACCG GAAGCTGGAG 2 0520 

GCTGGTGCCA GGCAGAGGCA TCCCAGATGC 2 0580 

GCACCACCAT GCCAGCTAGC CACTAAAGCA 2 0640 
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GCCAGTGAGG GCAGTCCAGG TGAGAGGAGG AAGGCCTGAG AGGAGAAAAA AAATATCCAA 
AATCCTGGGG TGGGTGGTGT CCCAAAACTG AGGCAGCATA GGCACAGTGG GAGCAGCAGA 
GACCTGCAGT GGCTCCTGCT GGGAATGGGG CAGGCCTGTG AAGGAGAGAG GGCTGAGCCA 
TAGGGCACTG GTGACTCAGT GAGATGGAAA GAGGGACCAA GTGTAGAACA GCTGGACCAT 
GAGAAGAGAG CATGCAGGGC AGTTCAAGAA CCTTAGAAGA GGCCATGTGG GCAGAGTGGG 
GCTCCAGAAG AGGGTATTGC AGTCAATGGG AGCTAGGAGC CTGGAGCCAG ATCTCCCTCT 
GTGAAGGTTA TTGATTATCA GTTTCTGAAG GATACAAAAC ATCCACTCTC ACTACCTCCC 
CAAGACCAGC AAAGGC AC C A ATGAGCTTGT GTTCAGGGAT CCATTGTGAG GGGAAATGGG 
AAAATAAAGG AGGACGTTAC CCTGGTAGCT GAG AGTG AG C CAGCAGTCCC TGTTAGACTG 
GAGAAAGGCA GGTACGAGGC CATCCACAAA GAATGCTGAA GCACCGAGCT GCAGTACTGC 
ACAGCATCCA ACAAGGCTGG GCTGCTCTGG GCTGGGGGTG GAGAAGGATG GCTACAGAAG 
TCAGTGTTGC CACTGTAGTA AATAAACTGA CCTCTTCCCA CACCAGCAGG CAAGAGAGCG 
ATCATCGGAG AGTCACCAGG CCTGGTAGAA TCTCCTGTGA TAGGACCCCA TGAGATGCAG 
CAGAGGGCTG CTGCAGGATC CAGTCAGCCC TCAGGCCTTC AGCAGCCAGG CAGGAGATTG 
AAAACATCTT CTCCGGGGCC CTCCTGTCCC CACATGAAAT ACAAACTTGG CAGCAGAGTT 
TCCCCAGTGA GATCCCAGCC AGGCTTCTCA TGGGGAATCA GCCTGCCAAG TCCCTAGGGT 
ACTTGGGCTT CTAGTCACTT TGTGAGTCCT ATCTGTAAAT AAAGATAACC AGGGAAACTT 
CCTTTTAAAA GGAAAATAGG TCCTATGGAG AAAAC AG AT C ACACAGAGAA AATGAAGTTA 
TCACTGACAT TTTCAAGGAA ATGAGAGCCA TGGAAAAACA AGGACTAGAT GGCTAGACAC 
CAAAGAAAGG GCTGGTGATG TAGCCCAGCC AG T AAAGG T A CCAGGTGCTA AACCTGCCAA 
CACGGGTTCA GTCCCAGGGC TCATAGCAAG AGCAGCCAAC TGTGGTTGCT ATGTAATGTC 
CATAAGGCGT CTTTGGAGTG TTCAAAGTAT CTAAGCTCCC ATGAAGGCCA TCCAGCTGGC 
TGCTTGGCTA ATATCCTTAA ACATCCAAGG TTCCAGAGAA GGATATAGTT ACAGTTAAAT 
CCCCCTGGCT CACAACATCT TAACTTATTT GAAAAAAAAA ATATCTGAGC ATGGCAGCTC 
ACACCTGAAA TCTCAGCATT TGGGAGCCTG AGGCAGGAGG GTTGCCATGC ATTGGAGGCC 
AATCTGGGTT ACACAGTAAA TACTAATCAG ACTACGTACA AGACTATGTA GATATACTAT 
GTAGCAAGAC TGTCAGAAAG GAAAAATAAA CATTAAAGAG GTAATTAGAG TAAACGCCCA 
CCATTAACTG TAATGGTATT TAATAGTGTT CAACCCTCAA CCAAATGTCC CTGGGAGGAG 
TTGGATTATT TTATGTCTCA T AC AC C T AAA CAGTAGCATC AGTGCGCTCA GGATTGAGGA 
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GCAGGCCAGC ACCACCAGGG GTGAGAGGCA TCCGATCTAG AAGATCCCTG CCTGAGGTAG 2 2440 

CCGGTAAGTG AAGTGGCTCA GAGAAAGTCA AGTCACGGAC AG ACT C C AAG ATTAGACTGA 2 2500 

CACTAAGTGC ACTGAAAACA ACCCTATCTG ACAGTAAGGA ACGTATTGGG TATGAGTGGG 2 25 SO 

GAAGCAAGTA CAAGAAAGAA AAGCCTTTCC CTGGTCTTTC ACCTGGCACA TCTGGCAACA 2 2 620 

GCAGTACATC C T AAG AT AAA CACTGAGTGA GAATCTACAA ACTGCTCTGG GGCCATATTG 2 2 680 

AGAGGATGAG GAGATGGGAC ACATGAGTAG CCAGTTCACT CTTCAGTGGA AGGTTCTGGG 2274 0 

GAGCTAAAGG TGGCTGCAGA TTCATTGCCT ACCCACCACC ACCACACACC CTGTTCTTGT 22 8 00 

CCTTCCTCTT GAATCAGAGC AGAGTCTTCA GCTGCTGAGC TCAGATACAG CGGAAG TG AT 22 8 60 

GTTGCACTGT CTCCGGCCAT GCTGAGAGTG CCACAGCAGA GCTGTGAGAA AGTTTGGGCT 2 2 920 

CCCTCGTACT C C AG C T C AG A GGCATCTTAG AGATGCATGC CCAACCCCCA CAGAACCACC 2 2 980 

CAGTGGTGGC CTTGTGGAGG AAACACAAAG TCTCCAGAAG ACCCCTTCCA AATTACACAT 23 040 

TTCTATCAGC TTTAAAAAAA AATGTTGGTT GTTCAGGGAT AGTTCATGAC ATAATATTAG 2 3100 

CAGAAAATGT CAGTAAATAC AG CTG AAAAC TGGAAATGAA GGGCTGGAGA GATGGCTCAG 2 3160 

CAGTTAAGAG CACTGACTGC ACTTCTGAAG GTCCTGAGTT CAAATCTCAG CAACCACATG 23 220 

GTGGCTTCAC AACCATCTGT AATGAGATCT GATGCCCTCT TCTGGTGTGT CTGAAGACAG 23280 

CTAGTGTTCT TACATATAAT AATAAATAAA TCTTTGGGCC AGAGTGAGTG GGGCCAGAGC 23 34 0 

AAGTGGGGCT GGAGTGAGCA GAGGTCCTGA GTTCAATTCC CATCAACCAC ATGATGGCCC 23 4 00 

ACACCATCTG T T C AG C T AC A GTCTACTCAT ATACATAAAA TAAATCTTAA TAAAAAACTG 234 6 0 

AAAAAGAAGA AATGGTTGTT TTCATTTGTC TGTTATTCTG AGAGGTGTGG TTTTTACAAA 2 3 520 

TAGTGGTAAC TATAAAAAAT TTAAAACCCA TGCAGATTGG GGGTGGACTA GGGAAATGGC 23 58 0 

TCAGTAAATC AAGTGCTTTC CACACACAGG AGATGCACTG GAGCTCTGAT CCTCTGAACT 2 3 640 

CCTACACAAG CAGGCGGCCC TGGCAGCTGC CTGACATCCC CGCACTCAGA GGCCCTGGTG 23 70 0 

AACTGACTAG CTAGACTAGC GGGACCCGTG AGCTCTGGGC TCAGACAGAG ATCCTGACTA 23 76 0 

TAGAAAGTAG AAATCAACCA GGGAAGGGGT CTGCCTTCAA CTTTGGGATG CCACATTCAA 2 3 820 

CCACATGCTC ATGCACACAC ACGCACGCAC GCGCGCGCGC GCACGCGCAC ACACACACAC 2 3 880 

ACACACACAC ACACTAAATA CCAAGAGGGG ACGTGGTTGC CTCCAAGATG GAAAATGCAT 2 3 940 

CTAGGAGCAT GAAGTGCTCT CCCATTTTGT TTTAATAAAC CTGCCAGATC CATTTGACAC 24000 

TTTACATCTG TGTATAATTT CAATTTAAAA AACTAAAAGT AGGGGGGAAG GCTGTTTATA 24 060 

TTTAGCCAGA ATGGATCCAC AATTGGTCTA AAAGCTTTCC TGTACATTCA GCAAGGAGTG 2 412 0 
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TATTAAACAA TCCATTATTC TAGTAACTAA GATAAAATCC CTGCTGACAG GCACCCTGGT 24130 

ATTCCCAGAC CATTAAAATG CTTCCATAAA GTCTGCTTAA AGACACAGGT AGCAGGCCAG 2 4240 

GTGGTGACAC ATCCTGGCTG CCTCAGCAGA CCTTGCAGGT CTAGGTGTGG AGCCCAGAGT 243 00 

GTGGGGCAGC CCTGGGGCAA CACAGGCAGA CCTCTGGAGG CCTGCGGAGG TGGCATGGCA 2 43 60 

GACGACACTG TAGGCAGCTT GCAGAAGAGC TGGCCAGGGG CCTTAAAGGA CATCAGCTAA 2 4420 

AGGCCTCTGT GGACCGAAAG CACAGGCTTG AGGGATTATT TGGAGTCGGG GTTGGGATGA 2 4480 

AAGGAATTGA CACAGATTAA AGAATCAACT CCACTCTGGT GGGTGCCAGA ACAAAGGTGA 2 4 540 

TGCTTTGTAT AACGATGAAG AAAGTTCTAG AACTAGGGGG CAGCTCCATG AT AGAAC AC C 2 4S00 

TGCTTAGCAG GTAAAAAGAG TCAGGTTCAG TCTTTGGCAC AACCCCCTTA AGAAGGAAGG 2 4660 

TTCTAGAGAA AGGGGTGTTC TGGACCTGAG AAAATTAGCT TGAATTTGCA TATAAGTAAA 2 472 0 

TTATGTT TAT AAGTTGAAAC TCTTACCGTG GCCCTGGAGA GTGGCTCACT CAGTTAGTTA 247 8 0 

GCTGCTCTTC CAGAAGACTC AGGTTTGAGT CCAGTGACTC ACAGCTATCC AT AACTC C AG 2 4 840 

T C C C AC AG AG ATCTGATAAC CTCTGGCCTC CTCAGGCACG CACCAGGCAC ACATGTGATA 2 4 900 

CACAGACATA CATACAGGCA T AC C ATG AAA ATAAATTTTA AAGAATTAAC TGTAACCAGG 2 4 960 

TCTGTTAGCA CATCCCTGTA ATCCCAGCTG CTCAAAGGGC TGAGGCAGTA GGAGAGCAAG 2 5 020 

TTCAAGTCTG GCTTTGGCTA CAGAGCCTGT GAGTTAAAGC CCAGGCAACT TAGCAAGACC 2 508 0 

CAGTCTCAAA ACAGAAATTA TAGGCAGGAG GTACCTGGAG CCATAGCTGA GGATGGGTAC 2 514 0 

TGGCCAGGCC TGTGTGAGTT CCCCAAGTTC TATTCTCATT CCTGAAAAAA AAAAAACAAC 2 5200 

AAAAAAAAAA ACATAAGTGG TCAGTTAAAC CTTAGGATAA GATAATCTCT TTGAACCTGC 2 52 60 

TCTGCCTTTT TGTGAGCTTT T ATG ATT AT C AAGGGTTTCT TTCTCTAGTA TATAAAGCCA 2 5320 

TCTTAGGGGG TAAGATCTAT TTAAGTCATT TATTTTACTT AAAACGGTCA TTTTACTCAA 2 5380 

GCAGGTTCAT GAACTTCACT GTGTTCCACA GTGTTCCTAA ATTGTACAGT TCTGGAAAGC 2 5 440 

AGTTAGCCAA ATACCAAGAA AATGAATGCA GAATAGAGTG AGGAACAAAG GCGGCCCTTC 2S50 0 

AGCATATTTT ACCTTAATAG ATTTTCCAGC TAATAAGACT GCTGCTGGAG GGAGAGTGTC 25560 

CTCCCGGTGC TCCTGACACC AAGTCACAGA AGAAATTACC GAATGCGGCA CTGGACACCT 2 5 620 

AGGACTTTGC ATTCCTCCAT G C C C AG AG AA GCAGGTATCA CTCAGAAGGA TGACAGGGGC 2 56 80 

TGGGGAGGTG ACTCAGCAGA TAAGGCACTT CCACAAAAGC CTGATGACCT GAGTTCAATC 2 5 74 0 

CCCATCACCC ACTTTTTTTT TTTAAAGAGA GGAAGGAGAG AACTGACTGC AGTTGCCCTC 2 5 800 

TG ACTTC CAT GTGCTCCCCA AGGCGAGCAA CACACCACAT CAT AC AC AT C ACAATAATAC 25860 
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ATTTTTAAAG GATGACTTTG AG C T AC AC C T GCCAACTGTC CCTGATGCTG CCACCACTAC 2 5 920 

AACTAGACAG AGGAGGTCTT GCCTGGTGGG TAAGTGAACA GTCAAGGGTG CCCACGGAGA 2 598 0 

. GCCACTTCTG CCAGGCCCAC TCCTGAACTC CTAGGTCCTC ACGGGCTCAG ACCCTCTTGC 26040 

CTCCGCTGAA GCTGCAGAAG GGACTCAGCT GTGCACTGTC TCCTCCCCCA GGGACCATGG 26100 

GGCGTGGTGA GGGAAAGGGG ACTGTCTCTT GCCTTGGTGG TAGATCAGTC TCCTTCCTGT 2 6160 

TCTCACACCA GAGCCCAGGG ATTGACTCAG GTGATGAGAG AGTGGAGAAA GGATCTACAC 2 6220 

CCAGCCCCCC TCTAAGACCC CATAGCAGCC CCAGGACATA AGTACAGAAG AGCTGGGCTG 2 6280 

GGCTATGCAT TTGCTTTATA CATTTGAGTC AGGAAGGTGG GCTTATGGTA CACAGCTGAG 2 6340 

CAAGGAGGCA GATTTAGCTC ATCTTTATAA GAGGTCTCTG TAGGGGAGCA GTCTTAGGCT 2 6400 

GCAGTTATCC CAGAGGAGGA AGCTGATAGC TTCTACATGG ACTGTTAAAA TTTGCATTCA 2 6460 

GACCAGGGAA AGGCTTTGCC ACCCCTCTGA GCTTCACTGG GGAAGGCTTC GCCACTCCAT 2 652 0 

GGGCCTGATG CGTTGGAATC CATGACAGCT CAGCCCATGT CAACAACACA CATTCACTTA 2 6580 

GGGTTTCATC TGCTCCTTTC ATGTAACACA AGGCTGCTTC TGCTACGTGT GGGGATTTGG 2 664 0 

AGAGTATATT TCTTGCTGGA AATGAATGAT CAAAGCAAGG CCCCACCTCC TAGGCTCTAT 26700 

CAGGATAGAA GGGTCACTAC CAGAATGAGC CACCTCCTCA CTGACGGTTG GCTCCACTTG 2 6760 

CAGGCCTTCC AGGATTCCAA GACTTGGTTC TTTGTTCTGA AGCTCAGGGT ATAGCTTCCT 2 682 0 

CTACCTCCAC ACACAGCCCC TAACCCTTCA GTGCATAGTG AAC C ACT AAG ATCTCCCACT 2S8 80 

ATGTCCCCAT AGCAGCCCTG GAGTACAGGT CCTGTCTCTT GCCCATTCTC AGGTGAGAGA 2 6940 

ACCTAGGCTC AGAGAGATGA CACTTCAGAA GATAATCAGA AAATGGTGGA GGTGATTGGG 27000 

AGCTCAGATC CAAAATGCAC TGCATTTCTT TATTAGATAT TTTTAATTCT AACGGTGTAC 2 7 060 

CTGGGTGTTT GGGCTGCATG TGTGTCTGTG CATATCACCG CTGTGCCTGC TGCCCACAGA 2 712 0 

AGCCAGAAGA GGGTGTTGGA TTTCTTTCTT TCAATTAGTA CTTCTCAAAA TTCAACTATT 27180 

CATGCATCAC TTTAATGATT TTTTTTTTTT TGCCATAGCC AC AT AATG G C CTGTGGTCAT 2 724 0 

ATTTATTTAA TGTTTTTCAT TAAACAAGCT TAGGCCTTTC CTTGAAATAA TTAGAAAGGA 273 00 

AAACTTACAG TTACCAAAAA ATAGAGGGCC AGCTGGGGGT TTAGCAAGAG TTGGTACAGT 2 73 60 

GTTCACCTCG TATGCACAAA GCCCTGGCTT CCACCCCCAG TACCCAGAGC TTGGGAGAGG 2742 0 

AAAGGCAGGA TCAAGAGTTC AAGGACATGG CCAGGCATGG TGGGGCATGC CTTTAATCCC 274 80 

AGAGGCAGAC AGATCTATGT GAGTTTGCAT TCATCCTGGT CTGCAAAGTG AGTCTTGGAC 2 754 0 

AGCCAGGGCT CTGTTACATA GAGAAACCCT GTATCGAAAA ATAAAAAAAC AAACAAACAA 27600 
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C AAC AG C AAA AGAGCTTAAG GTCATCTCTG GCTGTATAGC AAGTTTGAGC CCGGCTGGGC 
TATACAAGAC CATCTTAAGA GGGAGGAGGA AGGGGAAGAA AAAGAGGAAA CAAGAAAGGA 
GATAAAAGAA GGTGGGGGGA GTAACCAGAA CGCATTATAT AAATGCATGA AATTGTCAAA 
GAACTAAGTT AATTAAAAAG CAGGAAGACC ACCATCACCA GCCTCGAGTA GAAGGCAGCT 
GTGTATTCTA AGCCTGCAAA TAGCAGTGTG AGTCTTTGCT CCGGGGCTCT GCTTCAAAAG 
AGATGGTAAA GTTAGTACAA TGTTAGAGAA TTTCAGGAAC CAACTGCGAT CCTTTCCTCG 
ATATCATCAA AGGGGTGGAG AGAGAGACCA ACAACGCTCC ATAGCACAGG CCCATCACTC 
ATGTGCCTGA GAAGCTGGAG CCAAGGATCT GTCTCTTCAA GACTCCATCT CAATAATGGT 
TCAGTGACAT TTTATGCCCA TTGGTGATAG CTAAACTAGC CCCATTTCAC CTAAAAGCCC 
ACACCTGGCA CCGTAGTTTG TCCTGTCTTG CAAAAAATGC CGGTCAAGAT G G AG AT AAG A 
ACCGTGGCAG GAACAGATGC ATCTGATCTC AGTCACACTG CCAACCTATT CCTTCCTCCT 
GAGGCAGCTC ATGCTGAGGA GTGCTGGCTA GCACCAGTGG TACACAGCTG AAGACCATGA 
CTCGCCTTCT CCCAGAATTC CCAGCAAGAG GCATTGAGCC CAATAAGTCC CCCCTCCAGC 
CATGACTAAT TTTTGACAGT GTCCATCTTC TGATAGCCCT TGAAGGTAAC TACAGCTTCT 
GTGAGTTTAT GATTGTGATG ACTGTGGCAT TGTCAAAGGA TGGCATTTGC AAGTCCTCTC 
TGCCTTCTGG CTTGCATTTT CTCTTCTTCC TCCCCCACCT TGTTCCCCAA GCCTTAGGAG 
AGTGGCATCT GTGTCTTGTT CAGAGCTGAG CACTCAGCCA CCATTTCTTC TCAGTGCCTG 
GGCCTCACAT GCAGTCCTTG GGCAGTGGTT GGTTGGTCCA GTAACAAATA GGCATGTCTT 
GCCTAGCAGG TCTTATCTAG CTCTGGTGGG TTTCCAAGCA TGTAGCAAGA AGAGTCTGCA 
CTGTTTTGGG AGTCTCTGGA GCATCCCTGA CCAATGACTG ACATGGAAGT GCTCCAAACC 
TCCTGCTTCT GGGGTTTCTG TTTAGTAACC CACAGCCTCT AGGAACAGTG TTATCCAGAC 
ATGTAGGGTA TCTCTCTTCT AATGTGTGCG TGTGTGTGTG TGTGTGTGTG TGTGTGTGTG 
TATAATTGTG CTACAATATA GTAAGTTTAC ACACTTGTTT TGGTT AAC C A CCCCCACCCC 
ATCCCGTCTC CCCACTTCTT TCTCTAATTA AATCTTTCCA CTCCAAAGAG CATTACTGCT 
ATTGCAGAGA ACATGGGTTT GCTTCCCAGA ACCCACTTGG CAGCTTACAG CCATAGTAAC 
TACAGTTCTG GGGAGTCCAG TACCCCCTTC TGGCCCCTGC CTGCACCAGA TACACACACA 
CACACACACA CACACACACA CACACACACA CATATCATAC ACTTAGATAC CTGCAGGCAA 
GACATTTGTA CATATAAACT AAAAACTAAA TCTTAAACAA AAAAAAAATT TCCACTCAAA 
GTCTTCACCC TCTCTGTTTT CACTTTATCT GTGTCTTGCT ATCCCTTCTC CCTTAAAGGG 
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29100 

29160 

29220 

29280 

29340 
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AAGAAGGACA GAGGGAGGAG GGAGGGAGGA GGAAGGGAGA GAGGGAGAGA GAGAAAGAGA 2 9400 

GAGACAGACT CCTAGTTTCC TGGCTTCCAC AAGTGCTCCA AGGTAAGCAT GCATAACTAA 2 9460 

AGAATCAAAG CTAAGTAAGG GCTGGAGAGA TGGTTCAGTG GTTAAGAGCA ATGACTGCTC 2 9520 

TTCCAAAGGT CCTGAGTTCA GTTCCCACAT GGTGGCTCAC AACCATCTGT ACTGAGATCT 2 9580 

GGTGCCCTCT TCTGGCCTCC AGGTATACAT GCAGGAGAAA TGCTGTATAC ATGATAAATA 2 964 0 

AATATTTACA AAAAAAGAAT CAAAGCTAAG AGCCATATGT AAGGATGTAA CAGCATCTTT 2 9700 

CTGGGCCTGA GCAACACTAT ATATATTTTT CCAGTTCCAT ATGTTTACCT ATGAATAAAA 2 9760 

TTCATAAGTA TATATGCTTT G TTAAAAAT A ACAAAACATT TCAGGATAGC CAGGGCTACC 2 9820 

CAGAGAAACT GTCTTTAAAT AAATAAAACA AAACAAAACA AAACAAAACA GATACCAAAT 2 9880 

CCACAAGCAG TCCAATCAAT ACTGAAACGC TGGTTTTGCA AGCTACCGGG GTTTTAATCA 2 9940 

TCTTAACGTT TCTTTCTCTT TCCATCTTTC CACTTCTTTC CTGCCCTTCT TCAGCTTGAG 3 0000 

CTTTCCTCGC CACTGACGTC AGCCTTGTCC TCCTCACATC TCTCTTCCCA CTGCAGGCCT 3 00 60 

CATC CT CGAA CCTTCCTCTC ACCCTTCTCA GGCTCCTCTC CCCTCACCAT ATCACCCACA 3 012 0 

GCATCACCCT TCTGCAGCCC AGTCAGGACC TTCCTGGTCC TCTAAAGTCA GCTGGGGGAG 30180 

GGGCTTGCAG GCCTCAGGTT AGTCCTAGTT AAACAGAGCT AGCCTTTTCA GACAACTGAT 3 0240 

CTCCTTCAAA AGACCCAACT ACTGCCTTCC GTTTCCCCGT AAGTTCAGAT GTTAACCTGT 3 03 00 

CCAGACCTTC AAAAGTCCTA CTGCCTCTGA GCTTGAGCTT TTTCAGTGTG GGTAATGGGG 3 03 60 

AATTTTGGAA CTGAAATTAA GTCTACACTT AACAAAGGAA GGAACTCTTC ATCTACAAAT 3 0420 

TCAGCCACCA GCCAGCCTTT CCGGTTTCCA TCATTTCATT TGGATCATCT AGACCAAGTT 3 0480 

CTGGAATAAT TGCTTAGGTC TTCCCCCACC CCCACCCCCA CCCCACCCCT GGCCTGGTAG 3 0540 

ATCCCCCTCT CCACATCCCT GTTTTCCTTG TTACTTCTCT TCAGATTTAG TTTTCCGTGA 3 0600 

GGCAAGAGTG GAGAAGGGAG AGATGTACTA GCCTGTGCTC CTGTGTCACA CTCTTGCTAC 3 0 660 

TCAGTTCCAC TCTTAAAATT TCTGGTCCCA GAGGAATAGA GATGACCTCA CATGCAACCC 3 0 720 

TGCCTTGACT ACTTTTCTAT TGCTCTAAGG AGGCAACATG GCCACAGCAA CTTGTAAAAG 3 0780 

CATTTAATTT GGGGTTGACA GTTTCTCAGA GGTTGAATCC ATGACCATCA TGGTGGGAGC 3 0 840 

ATACCCGGAG GCAGGCATGG TGGACAGGCA GTCGTGGGAT GGCTCTGGAG CTGTTGCAGA 3 0 900 

GCACTTATTT GCTGATTGAA AGCTCAAAGC CTACCCCCAG TGACACACCT CCTCCAACAG 3 0960 

GGCCACACCC CCTAATCCTT CTCAAACAGT TCCACCAAGT ATTCAAATAT ATGAGCCTAT 310 2 0 

AGGGGCCATT CTCATTCAAA CCCCACCCCC ACCCCCGTGG CCCTACTAAG GGCATCAGAT 310 8 0 
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AGGGCCTATG GAAAAGTTAT AAACCCTCTC ACCACCACTC TGGGTTCCAG CAACCCAAGG 3114 0 
CCACCATTTT CTACTCTTGC TTAACCAACA CCACCCAGGA TCTCTCAGCC TCAGCCTGGA 312 0 0 
ATGAGGGAAC CCTCTTGTCT CTTTTCATTC AACTCCGTAT TCTTCCTTCA TTCCACCCAT 31260 
GGATGGAAAG ATTCACCCCC TCCACTGTAG AGTAACACAC ACGTATGACA AGCCACTTCA 313 2 0 

CTGCCCTGCA TCTTACTTCT GCTCTGAAGT TCTGTCAGCC AAAACGTATT GAGCACTGAA 313 8 0 

GACTGTCAGT TGCTGCTTTG TGTGGTGGTT ACAAGTTAAG GTCCGACTGT AGCTGTCTGC 3144 0 

TTG CTGG AG A GACTGGGAAC CAGTAGTTGC TTAGCCCATG GGGCTGGAGA CCTCAGCAGT 315 00 

TCCAGTGTGG TTCTGAGGAG AACCCATTCC AGCAGCAGCA GAGGTAGCCA C AGG AT AG C T 315 60 

TGACTCACAA GACTCATGAA CTCAAGAAGA GGAGAGATGA ACTTGTAAGC AGGGTATGTG 31620 

AGCTCACACC TGAGCGGTGA AGGCAAGCAG GTAAGAAGAG CTTCCCCTCG GACCTTCTGT 316 8 0 

CTGGGCCATC TACACTCAGA TGGGCCTCCC ACTTCATTTA CTAGAAGCAA GCAAATCCCT 317 4 0 

CTCAGGCGTG CTGAGGTTAA CCTAATCGGC ATAACGCCTC ATAGGTGTAC CCAGAGCTTG 318 00 

TCCCGTGATA CTAGATCCTG TCAGGTTGAA AATGTTAACC ATCTCAAGGG TCGTACACAT 318 60 

TCCAAAAAGG CACTGTGTTG GCTATTCTTG GTTGTCAACT TG AC T AC AT C TGGAATTAAC 319 2 0 

TAAAACCCAA GTGACTGAGT ATGCCTGGGA GGGAGATTTT CTTAAGTCAT TTGAAGTGGG 319 8 0 

AAG AC CC ACT TTTAATC C AG AACTTCTAAG GTGGGCAGAT TCACCTTTAA TCAGCCTATT 3 2 040 

TCAATGACAT GGAGGATGGA AGTTTGTTCT CTTTGCCTGC TAGCCCTTGT TGGCAAGTCC 3 210 0 

ATCACTTCAC TGAACCAAAG CCTGTAAGGC ATTCTTCCTT TGTTTGTTGG GACAGGGTTT 3 216 0 

CCTGTAGCCC TGGCTATCCT GGTATTCAGT CTGTAAACCA GGCTGGCCTT GAACTCAGAG 3 2 220 

ATCCAAGTGT CTCTGCTTCC CAAGTGCTGG GATCAAAGGT CTGAACCACT AATAAATTGT 32 28 0 

GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT ACACATATAT ATGAGAGGGA 32 34 0 

GTGAGAGAGA GAGTCATTCT GTAAATTCTG TTCCTCTGAG AACCCTGACT AATAAAGCTG 3 2400 

CAGACTGCTT AGTATCCTTT TTGTTCTCTT TGGGGACACA CACAAATGAG TGAACGGACT 3 2 460 

ACAGTGGGCA ACATTCTTCT ATGTCTGGTG GCTGCCCTGG GGCTGTTTAG TCCACCCTTG 3 2 520 

TGTGAGGACT CTTTTGCTCT CAAGTGCTGG CATCTGACCT GTGCCCTTTT AAATCTGTTG 32580 

CTAATTTTGT CTCTGGGGTT C C AAGT AG AG ACTTTTCAGT GATCTTTCCT CATGATGAAA 3 2 640 

ATGGGTGATC TGTTATTGGA AGTCCTTGGC C T AAG C AAG C TCTGATTTAA TCTAACTATA 32 7 00 

TCATGTGCTC TTCTAATCTA TTGCTCCGGG TCCCTGAGCA TTGCTGTACT CATTCATGGG 3 2 760 

TCATTTTGTC ATTAATCTGG CTCAATCCAT GTTCACAATG ATGATTTGAT AAAGGCTGAA 3 2 820 
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AATGTGAAGT GGATGGTAAC AGTTCTGTGC CCTGGATTCC AACAAAGAGA TGCATGCTCC 3 2 880 

TCCAGCCCAC TCTGGGTGAC TCTAGGGGAC GGAGACAAGG GTCTTACAGA GATGTCAGAG 3 2 940 

TATCTGACTC CTTGACAGCT AGTGGCCTCA CAGGGAGACT CATCAGGGGT CAATGCTCTT 3 3 000 

TCTGGTAAGA TGAACTCCAG CTCACCCTGC ATCTTGATCT GTCCACACTG CTTGGTGTTG 3 3 060 

AGACTTCCTG TAGCCATGTA AAGTGGGACA TCTGGCCTAC TGGTGATTCT CTAAGAAGGA 3 312 0 

ATTTCCACCA AGCAGGACAC CTGAACACTT TCTTAACATT GACTCTTACT TTGGCTACCA 3 3180 

AAAGAAGCCT TTGAGCCCTA TGTGGTAGCA CAGACCTGCA ATCCCAGTAC TCAGGAGGTA 3 3 240 

GATGAGGTGG ATCTGGAGTT CTAGGTCATC CTTGGTTGCA TAGCAAGTTT ATATTTGAGC 3 3300 

TTGGCCTTGG CTGCATGAAA CCCTTGTCTT CCAGGAGACA AAAACAAAAA CAGGCAAATT 3 3 360 

TCCCTTAAGA AGCTCACACT CCGCCTATCC ACTGTGCTTG CCTTCTTCCC AATCACTATG 3 3 420 

GCCTCCTCTC CTCCATTAAC GCCCATGCTT AAAGGGTCTT CTAAAAATGT CTTTTAGTAA 3 34 80 

ACTCCAATTC TACTACATTT AAAGAAGGGG GAAGGTGAGC CCCACATGCT ACACCCCACA 3 3 540 

GTTCCAGGGT GCTAGGCTTC CGGCTGGGGG CTGCCTCTTG GTACTGCCTT GCCCTGGAAT 3 3 600 

GTCAGTTCAG CTAAAGGCCT CACACAAAAG ATGAAAGCCC TGAGTCCTCT TACTGCTTCT 3 3 660 

TAGCACACAA GCAGTTTCCT TCACTCCCCT AGGTCTTAGC AGGCCTTCAT CTTCAAGGGT 3 3 720 

TCTCTTTCCC TCTATTCTGC CTTCTCTGTC TCTCTCTCTC TCTCTCTCTC TCTCCCTCCC 3 37 80 

TCCCTCCCTC CCTCCCTTCC TCCCTCTCTC TCTCCCTCTC TCTCCCTCCC TCTCTCTCTC 3 3 840 

TCTCTCTCCC TCCCTTCCTC CCTCCCTCCC TCCCTTCCTT TCTTTCCTTT CATTTTCTTT 3 3 900 

CCCTTTTTGT CCCTTCATGA GAAAAAGCAT ATTTGTAAAT CCCAATTTAA AATATAAATA 3 3 960 

AACGAAAACA GTAAGT CTC A ACCAAATGAG GCCTAAATCA GCCCTGGAAG ATTAGTACCT 3 4 020 

GTTTCTACTC AAGTTAATAA TTTACTCTGT GTCCCTCTGT GCATGCTTGG CTTCAACAGA 3 4080 

GGATCTTTAA CATGGGATGC AACTTCGCCA GAGAGCTTCA GTTCTCAGGA GGCATGTGGA 3414 0 

CATCGTGGAG GTTGAG GAGG GGCAGATGGA TGCTGGGAAG CAAATGGAAA GCCTGAGGTT 3 42 00 

CCAAGTCAAA TCTGTGACTC ACGCAGTAAG GAGGTTTGAG CTGGGGCTGC CCAAGGGAGG 3 42 60 

AGGGCTACTA CAGGCAATGA TTAAGATTTA TGTATTTATT TTATGTATGA GTACACTGTC 343 2 0 

GTTGTATAGG TGGTTGTGAG CCTTCATGTG GTTGTTGGGA ATTGAATTTA GGACCTCGGC 3 43 80 

TCACTCTGAT CAACCCCGCT CGTTCCAGCC CAAAGATTTA TTTATTATTA TACATAAGTA 34440 

CACTGTAGCT GACTTCAGAC ACACCAGAAG AGGGCATCAG ATCTCATTAC GGGTGGTTAT 3 4 500 

GAACCACCTT GTGGCTGCTG GGATTTGAAC TCAGGACCTT CTGAAGAGAA GTCCGTGCTC 3 4560 
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TTACCCACTG AGCCATCTCA CCACCCCCTT AAATTGTTAT TTTTAAAACT ATATGAAATA 3 4 620 

AACTTTACCA TCTAAATGGG GAGGGGTGAC CAGTCTCCGC ACATAGGAGG TAT AAGGG C A 3 4680 

GGAAGATCAG ATCTTAAAGG TCAGCCTACA TGAGACCCTG TCTCATAAAA ACCAAGTAAT 3 4 740 

TAATAATAGC AATTAATAAT TAATAATAAT AGG AC AG C AG TAGCACTATT TGGTTGCTGG 34 800 

GGATACAGCT CTAGTAGAAC ACTTAGCCAA AGGGTCCTAA ATTCAATGTT GAGGACAGCC 34 860 

AAAAATAAAA TAAAAAGTTC CATGTTGTTC CCCCACACAC ACTTTTTTTT TTTTTTGAAT 34 92 0 

GACTCTCACT ATGTAGCCCT GCCTGGTCTG CAATGTACTA TGTAGCCTAG GCTAGCCTCA 34 980 

TACTCAAAAG AGGGCTAGCC TGCCACTACC TCTGCCTCTA GAGTACTAGA ATTATCAGCA 3 5 040 

TGCTCAGGCA CACTGGGTCT TGTTTGTTTT TTTGAGACAA GATCTCATGA ATCCCCCACT 35100 

GGCCTCAGAT TCTCCATGTA GTCAACGATA ATCTTGAATT TATACTGGAA AATGGTAGCA 3 516 0 

ATCTGGAGAG TAACAAGACA GGAG CTGACT GTGTGTATGT AGCCCAGGAT GACCTTGAAG 35220 

CCTGCCTTGG C C T AC AG AG C GCTGGGACTA TAGGGGTATC CCACTGTGCT TGCCTGCCTC 35 2 80 

TATGTAAAGG TGGAACGAAT TTCCCCTGTG CCTGTGGACC ACGTTTCTCT GACCCACTCA 35340 

TCCACCAGTG GGCGTTTGGC TTGACCCCAC ATCTCTTGGC CACTGGGGAT GATCTGAACC 3 54 00 

CAGTGCATTC TTCTCAAAAT ACACTGAGGT GGGATCATTG GAT C AC AG AC GTTCTTAGAG 354 60 

CCTAGCCTAC CCCCTGGGGC TACAGGAAGC TCACAGTTTC TGTTGGTTGA TTGGTTGGTT 3 5 520 

TGCCCCTCCC CAAACCCCTG CCACCTCCCC CCAACCTGGG TTTCTCTCTG TGGCTCTCTT 35 5 80 

GATGTCTTCA AACTCACTCT GTAAACCAGG CTGACCCTGA CCTCAGAGCT CTGCCTGTCT 3 5 640 

CTGCCTCCCT AGTGTTGGGA TTAAAGACAT GTACCATCGG CTATACCTAC AGACGTGCTC 357 00 

AAGGTATGTA CAGAGCACTC ACCCTGGCAT CCCTTCACCT GCCTAAGAGA CTAAGGATCA 3 5 760 

GAAGTAAACC CTACCTGCTT CTCTGGAAGA TTCAGGTTTT CCTCAGGGTA CTGCAGCCTC 35 820 

TCAACCTAGC ATGGTCTGGG CCTTATCCTT ACGAATGTAC ACTCAAACAC AAAGACAAGG 35 8 80 

CTCTCCCAGC CTGCCCTAAT AACTTTTTTC ACCAAACAGG TCATGAGTCA ATGGTGCCCC 3 5 940 

GATATTGTCT AGGCAATAGT CATTCTGGGA CTACAGGCCT TGGTACCCAA CATGACTCCC 3 60 00 

TCAAAGCCAA GATTGTGAGC ATGTCACTGA GGCCACTCTG TGAGCTTGTT TCCATGTCAA 360 60 

CGGAGCTCAT GATGTCAGAA GGCTGAATCC AGACCCTGCA CCCAGGCTGT GTGTTTCCAG 3 612 0 

CTCCACCCCA GAGCATATCC CAGTCCAGCT GGCTCTTTGG AACCATTAAA GAGTGATAGG 36180 

TGCTGACTAT GTGTGCAGAG AGTGATCCTA GCAGCACAGG ACACAAATCC TCACCCTGGG 3 6240 

GAAAGCAGCC TTCAACCTCT CACCCTTAAG GGGAAGGGCA ACCATGGAAC AGCATCTGTC 3 6300 
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AGCCCTCCCT CACAACCCCC CAGGCTGGCC TAGCCACACC CTGCCACTTC TATCCAGGCA 3 63 60 

GCAGGGCTTC CTTTCCAGAG CAGGGGGGGT GGGGTCAGGG AGGAGCCTGG GGATTAGGGA 3 6420 

GGGACACTGA GTTCTTCAAG CAAGAACTGT TCCCCATCTA AGGCCATCCC CTCCTCCAGC 3 64 80 

CCCAGCTATG CAGGGAGCCT GGCTGCTGCT GCTGCTGGGC CTCAGGCTTC AGCTGTCCTT 3 6540 

TGGTGTCATT CCAGGTAAGG AGGCTCCCCT AACTGCTTGT CCCCACTCAC AAGCACAGCC 3 66 00 

TTCCACTGAC ACCTGCCTCC GGTCTCCCCC TTGGCCAGTG GAGGAGAAGA ACTCGGCCTT 3 66 60 

CTGGAATCAA AAGGCGAAGA AGGCCCTGGA TGTTGCCAAA AAGCTGCAGC CCATTCAGAC 3 672 0 

ATCAGCCAGG AACCTCATCA TCTTCCTGGG AG AC AG TG AG TGTGTGAGCA CGGCCTGGCC 36780 

ACCCTGGGGC CCCCTGAGCT CCAGGCATCC ATTGATGTGT CCAGGAAAGC CTGGTGTTCA 3 6 840 

GATCGAACCA GATTCTGTTT TTGTAGGGTT GGGGGTGCCC ACGGTGACAG CCACCAGGAT 3 6 900 

C 36901 
(2) ANGABEN ZU SEQ ID NO: 7: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGS: 13330 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Doppel Strang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Genom-DNA 

(iii) HYPOTHET1SCH: NEIN 

(iv) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS: Homo sapiens 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7 : 

GATCCACCGC GCCTTCCCCG AGCAGGCCCT GCTGCGCCGG CACCCCCCGC CCCAAACAAG 6 0 

GATGCTCAGT GACCTGGTGG AATTCTGCGA CCAGATGGGG CTGCCCGTGG ACTTCAGCTC 12 0 

CGCAGGAGCC CTCAATGTGA GTGGTGGGCA GGATTCGGGG GAGGCCCTGC TTGGGGGAAA 180 

GAAGAGAAAG ACCTGGAAGG TGGGGTGGTC CAGCGGCCTC TGCTTCCCCC CAGAGTCCCT 240 

CCCCTTCAGC CAGGTCTCTC CTGTAGGGAA GGAGGCCCTG GGAGAAAGGG CCCCTCTGAG 3 00 

TCACAGGGGC CCTGACAGTG GGACCTGCCC CTTCACCAGG ACTGTGCCAA GCGGGGGGAC 3 60 

CCTGGAGGCC TAGCAGAGGG CAGGGGTCCT GTGGCCAGAA AGGGCTGGTC TTGGGCCCAG 42 0 



AGGCTTTCAG AGTCGGGGCT GGAATTGTAG GAATCCCGGG AATGSTCOTG *STGGGTA€TT* • * 4*S0 

TCAGGTGCTC CCTGCCTGGG GCAAAGCTAA GAAACCCAGG GCCTTGGCTG TGGTCCTGGA 54 0 

GGAGGGAGAC ATCTCACCCA GGCCCAACCC TGGGAGGGGA AGGCAGGTGC CCCAGGCCAG 60 0 

AGAGCTGGAG CCCAGTGAGT CCAGGCCAGC CAGCAAAAAC ATGGAAGTGT GGGCCACAGG S60 

GTGTGGGCGG CTGCCCCCTC TCCCCACCCA TCCCCTCTGA GCAGGGCTGA GCCCCACAGG 72 0 

CAACTCCTCC CCCCAGAGCC GGGCATGAGG TGCTCAGCGG ATGACAGGGC CCAGAGTCTC 780 

TGCCCGAGCT GGACCACACG TCACATAGGT TTCTGGGATT TGCTTCTAGA AAAGCCTGAC 84 0 

CCAAACATTT GGAGATGACA AGTACTCACT GGCCCGCAAG GAGGTGCTCA CCAACATGTG 90 0 

CTCCCGGCCC ATGCAGGTAA GGAGGGCCCA GCCCCGGCCT CCCCTGCTCC CAGGAGCACA 960 

CTAGCCCCAG ACCTGTGACC TCCACGTGCA AGCACAGGCC CCCACCGTTC CTGCCTGCTC 102 0 

TGGACATGGC TGGGTGGACG GGGGCTGCTC CTCCTCTGCC AGAGGGTGGG AGAGGAGGCC 10 8 0 

GACCCCAGGC AGCACCTAGG AGGGGGCACC CTGAGCCTCT TGAGTTTGAG CCGCTGTCTC 114 0 

CTGCTCACAC TCGCTCAAGG ACAGAGTGCC CTGGAGCTGA GGGGCTACTG AGACCTCCTG 12 00 

TCAGGCTGGG GTCCTGGAGG AGAGACAGGG TCCCATGTGG TTTCCTGTCC CAGGGAACAC 12 6 0 

TCCGCAGCCT CCATCCCCAC ATGTGGAGTC CAGAACTAGC TGTCAGCCTC TGGC CAGTGT 13 2 0 

GGGAAAGAAG CGGACTTGGC CGGGGGCCTA GGCCTGGGCC TGCAGGGAGG TGGCAGCCTG 13 80 

TGGGGTGGAC AGCTGGGCTT GCTCTGGGAT GCCTGTCACA GCGCCCCAGG CTGAGCTTCC 14 4 0 

CCCATGCAGG GCCCGAGCAT CCTGGGACCA GGACCCCAGA GGACCCTCGG GTCAGCGGGA 1500 

GCAGTGGATG CTGATGGGTC GGCTCTGGGT CCCACCCCGG CCCAGGGGCA GAGACAGGCT 15 60 

GTATTTTAGG GGCTCGGTCA CTCGGCAGAT TCAATCTGTT CACAAGAACT GATGGCTTCA 162 0 

GCTGACCTCA GTGGATTTAT TTTCTGACAC TTCAAGCTCT GCTGGGTTTG AAGCCATCAG 1680 

GGCCTGCTTG GGCCTGGTCA CCGTGACCTG CCCCCAGTCA CAAGTGTCTG CCCAGCCAAG 174 0 

CACCTGTGGC ACCCACAGCG GAGAGGGGCT GGGCCGTGCC CACTGGGCTC TCTCTGTTCT 18 0 0 

AC ACTGC AG C GGCTCTAGGC CTGGCAGAGA AGGCACAGCA GCCCCTGAGT CCCAGAACTG 18 60 

CCTCTGGCTC TGCCCTGCTG GGGCCCCTCC CATGTCCCTG CCTCTGACGC CATCACCTCC 192 0 

AAGGAGGTAC AAGCCAAGCT GGAGCTCCAG AGATCGGAGC CGCTCCGGAG TTAGCCAGAG 1980 

CCCGAAAAGC CTGCATTCTC CTGGCTCGCC TCCCAGGGAG CTCAGAGGTG CCCTTGCCCG 2 04 0 

GGAATCCGAT GGCAGAGAGT TACC AGGTCT GCGGTGCTCC TGTTCCTCAG CCCCGGGAAC 2100 

TGGGGTGGGG ACAGGGCAGG G C AG C AG C AG AGAGCACAGA AAGGTGTGAG GGGGCACACA 216 0 
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GTCCCCAGTG AGCATCTGCA TCAGGACACC AGGGCTGTCC GAkGGtTGTC CC^GGG^.lSC? ' " 222£)* 

CTGGGCCTGT GGGAAAGCCA TGGTCCCCAC CCATCCCACC CGACCCTGAG CCACCTCCAC 22 80 

CAGCCAAGAG GGGCCAGGGC CCTTCATCAA CCTCACCCAG GTCATCTGGG GAACTGGGCC 2340 

ACCACTGAGA ACAAAGC CCA GACATGTCTG GGAGTGGAGG CTGTGCCCAC CTCCCCCAGA 24 00 

GACTTGCCCC CGACTTAACC CAGGGCCCAG CAGGGGCTGG AAGGGAAGTG GAGTTAGGGA 2 4 60 

GCGGAGCAGG TCACCATCAG CTGCGCCCTG GATTCCAGGG CCCGTGTGCA CAGAGTAACG 2 520 

GGAGCCGGCT GTCTGTCTGG CCAAGGGCAC AGGAGGGTGA GTGTGTACAG CAGCCAGGGA 2 5 80 

GCAAGGGAGC CAGAGAGACA TACAGGCGTG ACCTTGGACC TCTGCGAGGA ACCCGTTCAC 2 640 

TCGCTCCCAG GCAGTAGCAC TGGCCCTGAC ACCCAGCCCT GAAAGCTCGG GGACTGCAGG 27 0 0 

ACAAACAGCT TCAGGGGCTG TGGCCCCAGC TGGGACGGGC TATGCGCTGG TCCCTAGAGA 2 7 60 

CTCTCGGTAT CTCCCCCTGC CCCAGTCCTG CCTCCTGCCC AGCACAAGGG CCTTTGGAAC 2 8 20 

TCAGCCCTCT GTGTCTCAGC CCCCGGGAGG GTCAGGTGTC AGAGACGAGA AGGGCCGAGG 2 8 80 

CTGGCAGGCC GGAAACTGCC TCCCTTGACT GCTGTGGGGT GGAGTATTGG CGAGCACAGA 2 94 0 

GGTGCCCGGG TGAAGCGTGG CTTCAGCTGG GCGGGATCAG TGCCAGAGGG GATGAGGACG 3 0 00 

GCCCCGACCA AAGGTGGGCC TAGGCTGGAG AGGAAGCTCC AAGAGCCTGA GGCCCGTATT 3 0 60 

GCACAGGGCA GGGGATCGCA TCCTGGGCTT TCTCTCCCTC CTCCCACTCT GGCCAGATGG 312 0 

GAGGATGGAC GTTGCCTCCT TGAACAAAGA CCCACAGGCT CCTTGGCTTC TGCTTGTGTC 3180 

TCCAGCAGAC AGCGTCTGCA GCCCCTGGTC CAACAAAACC GCAGGCGGCC TCCTCCTCTT 3240 

CCTCCTCCTC ATTGTCCTCC TCGACCACCA CCACCTCCTC CTTCCACCAC CTCCTCCTTC 3 3 00 

TCCTCCTCCG CTGTCGCCTC CTCCTCGTCC TCCTCCTCCT CCTCCTCGTC AGCAGTCGCA 3 3 60 

GCCTCCTCGT CCTCCTCCTC CTCATCCGCA GTCGCCTCCT CCTCCTCCTC TGCCTCCACC 3 4 20 

TCTGCCATCG CCACGTCCTC CTCCTCCTCC CCCACCCCCC GCCGCTACCT TTCTTTCTTC 34 80 

TTCCTTCTTC CTGGGCGAGA GTAGCAGCCC CGGCCCCATG CTGGGGAAGG GTAGGCCAGA 3 54 0 

GACTCTTCCC TCCTGGTGGT GCTCAGCAGT GACTCAGCAG GGACTGGACT TCGGAGGCTC 3 6 00 

AGCTCGTGCC CCCTACCCTG ACAGCATCCT GGGGGTTCCT GGCTCCCTGG TCCTCAGCAG 3 660 

GGTGGGCTTG TCCAGGCCAT TCTCAGTGCT GCCACCTTGA GGGCATCTGG GAGGCCCAGG 3 720 

CAGGCCAGAT TTGTCTCCTG GAAAGGACAT GGGTACCCCT GGGCTCTGCC CAGCCTCCTG 3 7 80 

GCCTCCCCCT GGGGCCCCTT GTGCAGCAAG GGCCCTGGCC CCAGTCCTCC CTGGCGTCAC 3 84 0 

TCAGCAACCA GCAGCCCATT AGGTCTGTCC ACACATCGCT GCCGACGGTG AGGCTGTGGG 3 90 0 




TGGTGCCAGC CTTCCAGGCC TGGCTGGGCA 
CGTCCCGCAG ATGGCACTGT ACTTCTGCTC 
GCACTACGCG CTCAATGTGC CCCTGTACAC 
CGACGTCCTG GTGCACCGCC TCCTGGCTGC 
GGGCAGACCT GGGCCAGCTC AGGGCTGCCC 
ACCATTCTGC CGTGACAGCG GAGGTCCAAG 
GCCTGGAAAC TCTCCCTACG GGCCGGTGCT 
CTGGACACAG CCGGGAGGAG GGCGCTGACC 
CTGGGTGCTT GGGGTCCTAA TCTGTCGGCG 
GCCATAGCTC TTCCCAGCCC CCCAGGCTCC 

•CTATAGGGAG CGACTAGACA TGGCGCCCGA 
CGACCGCCGC ATGGCGTCCA AGCGCGTGCA 
TCTGGTCAAG GTGAGCCCTC CAGCCTGGTG 
CTGGGCACCT GCTCACCAGG AGGCCTCGAG 
GCTGCAGCAC TGTCCCTGCA GGAGAGTGGC 
ATCCTGAAGC AAGCCTTCGA CGTGCTGGTG 
TGCAACGTGA GTGCCCTGGG AGAGCCCGGG 
CTGGAGGGGC ACAGGCTGTG ATGGGTCACA 
AAAGCCCACC TGATGGGCCT TGCTGAGACG 
AGGCCCAGGG TCAGGCCTGG CCCCCTTCCC 
^^^^ TCCATGGCCA GTACAGCTCG GCAGGGTGTG 
TGAAGGAATG AAAGGCCAGC GAATGGTCCG 
ACAAGGAAGA GAGCTGTCCC TGGCTCGGCT 
CTCTCTCCAA GGGGACATGG GCCTGTCCTA 
CCCTGGGGTC TGCAGGTCAC CACCTGCCTC 
GAGTGCCCTG GGAGTACAGT GTCCAGCCCG 
GGGAGCTGGG CAGAAGAGGA ACGACAGAGT 
TGAAGTTCAA GCCTAGCTCA CCCTGCTGTG 
ACCAGCAGGG GGCGCAGCGC TCCGCCGCCA 
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GCTCTGGGCT TSTCiGGG-'SC 'TCACCiMtc'I* 3 9,50 

GGGGCTGCTG CAGGACCCAG CGCAGTTCCG 4 02 0 

ACACTTCACC TCGCCCATCC GCCGCTTTGC 40 8 0 

CGCGTTAGGT GAGGGGTGCA GTCGGGGTCA 414 0 

ACCCCCACAG TGGGTGCTCA GTGGCCCAAG 42 0 0 

GGTCGGGCGA CCCAAGTGCA GGGGAGCCTG 42 6 0 

GCAGAAGCTG CATGGAGCCC ACAGCCAGCC 43 2 0 

TCGAAGGGCC GCTTTCTGCT GCCCTGGGAG 43 8 0 

GGGGTGCAGC GCCATGCAGC CCATCCCCCA ' 444 0 

CACTCTCATG CCTCACCCCC TCTTCCCAGG 450 0 

TACCCTGCAG AAACAGGCGG AC C ACTGTAA 45 6 0 

GGAGCTCAGT ACCAGTCTCT TCTTTGCTGT 4 62 0 

CCCCTCACCT CCCTCTGGCT CCCGACCCTC 4 680 

GAGCCCAGGG CAGTGCCAGG AGGTGCCATG 4 74 0 

CCCCTGGAGT CAGAAGCCAT GGTGATGGGC 4 8 00 

CTGCGCTACG GCGTGCAGAA GCGCATCTAC 4 860 

GGCGGGCAGG GCAGCCCAAG CCATCCCGCA 4 92 0 

CTCCACCCCT CGCTCCCCCA GCCCTAGCAC 4 98 0 

CCCAGCTCTC CCACCTGGGA TGGTGGCTCC 5 040 

CAAGGACCCA GGAACCAGAG AGCAGGCCCC 5100 

CAGGCTTTGG GGACTGTGTT TATAGGAACG 5160 

TGGCCGCTTT GGAAACTGTG TCCCCTGAAG 52 20 

CCTGCCCTGA GTGACTGTTG ACTCACAGTT 5 2 80 

ATGCTGCCTT AGGGGCTTGG CTCCAGCTGG 5340 

TGTGCCTGGC TTTGAATTTC CTAACATCCA 54 00 

TTGTGTGCAG TAAACGTGGT GTTCATAACC 5 4 60 

CCCCCTGCGG ACCCTGGGGG CTCTGTATCC 5 52 0 

GGCCCAGCCC TGCCTGCACT G AC AGATGG C 5 5 80 

CAGTTCTCTG TCCCCACCTC AGTGCAGTCA 5 64 0 
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GCCCTGGACC CCCCACCACT TGCCCCCCAT AGCACACAGA GCCACCGGOC" f TCCCAGGC'c**** 5 7 00* 

CCACCCCTGG CCCTTGGTCA CTCTCACCTG CTGCCTCAGC TGAAGGTGGC CTGGCAGGGC 5760 

CTCCCTGAAG CTCCCTCCAG CCAGGCAAGG GTGGGCCAGG GCCGAGGGCT GAGGGCCGCC 5 82 0 

TCCAAGCATT GAAGCCCTCC AGGGTGGAAG GGCAGGCAGC AGCATCCAGA GCTGAGGCCT 5 8 80 

GAGGCTTGGT GTTTGCACTC CAGGCACTGG CCCTGCGGTC CCACCACTTC CAGAAGGTGG 5 940 

GCAAGAAGCC GGAACTCACG CTGGTCTGGG AGCCTGAGGA CATGGAGCAG GAGCCAGCAC 6000 

AGCAGGTCAG AACCCCTCTG TGTCCCAGCC CCCTAAGTCC TGATGACCCC TCTCCTGCCT 6 0 60 

CCTGCGGTGC CCCTCATTCC TTCATCTGTG TCCCCTGGGC TCCCCCAGCA CTGCAGCCTC 612 0 

CCGGGTGGGG TTTTAGGGCC CTCCCAGCTC ACCCAGACCC CCTCCTGTGG GTCCTGCTTT 6180 

CTGGCACCAC CTTCCCTTCC TTGGGGGCAA C C AC AGTGGA GAGAGGAGGG GCTCTGCCTG 6240 

TCCCGCTAAT GCAGGGGTGC TGGCCTTCTA GGGTCCTTTA GAGAACCTGA TGAAAGCTAT 6 3 00 

GAGTTTACAC CCAAGAAATT GTCTGGAACC GTTTTCACCA ACAGTGTGCC CTGAACGCGG 6 3 60 

ACCCAGGCCC TCAGGTTGTG TTTCATAAGC CTTGGGAGCG CTCAGGATGC ATCTGACTCC 64 2 0 

CCAACTCTGC CCTGACCCAG GGCATTCTTC CTGGAGGGGG CCCCCATTAC AG AC AGG CG A 64 80 

GCAGAGGCTT CCAGAGGCCG AAGGAGGGGC CAGGGGTCCT GCTGCAGGGA TGGAGGCAGA 6 54 0 

GCTGCGCCTC GACATCAGGC CCTGCCATCC TTGTCCCCTC ACGGCTGGGC TCTGCACAGG 6 6 00 

T C AT C AC CAT CTTCAGCCTG GTGGAGGTGG TCCTGCAGGC AGAGTCCACA GCCCTCAAGT 6660 

ACAGCGCCAT CCTGAAGCGG CCAGGCACCC AGGGCCACCT GGGCCCTGAG AAGGAGGAGG 6 72 0 

AGGAGTCTGA CGGTGAGCCC GAGGACTCAA GCACCAGCTG AGCTCCACCA GCCGCCTGCC 6 7 80 

CCGCCTGCCC CGCCTGCCTG TCCCGCCACA CTGGCTTTAG G AC CTGTTG A CACGGAGGGG 6 84 0 

GGTTTTTAAT TTGGTTTTTA ACAACTCAGG GGTTTGTTTT TATTTTTATT TAATTTTTGC 6 9 00 

AGCTCAACTT TTAAACAAAC TGCAGGGGAG AGGGTGGGGC TGGAAGGAAG GCTGAGGCCT 6960 

GGTCAGCAGT GACCCCAGCA GAGCAGGCCC CAGTCCTCCT GGGAGGCTGG CCCCCCTTTT 7020 

TTCTGGGCCC TACTGCCCTC CTCTGCCCAG GAAATGGGGG GGTTTCAGCA ACTCAGTGTC 7 0 80 

ACAGAATAAA ATCAAGTGTG GAGTGCCATC TGGTGTGTAG GGCGCCTCTG GGAAGCCTGG 714 0 

GCAGCAGAAT GCCCCTTGCA CCCAGGGCAA GGGACCCAGT TCAGGCTTCA CCCCTCGCTG 7 2 00 

CTGAGCCGAT GTCAACACCT GGAACTTTCC TGTCAGTTCC AACACGATTC AGAGCTGGCT 7 2 60 

GCCTGGCAGA TGATTGATAC TGGAGTCTCA TTCTGCCTGA TTAAAAATGG AATTAGTATG 7 3 20 

CAACACTGAG AGCGCCCCCA TCACCCTGAC GAATGTGACT GTGTCTGACG AATGTGACTG 7 3 80 



TGTCCAACCC TGCCCCCACT TCCTCTCTGC ACCAGCTCCG SAGQGCCTCG**PGGGAGTCAT** 74*To 

GGGTCCTGTG ATACCCCCTC CCCTCAGTTC CTCAAGCAGC ACTCTGTGAG GTCCTGTGCC 7 50 0 

CAGCTCTGGT GTGAGTGGGT GCCCCGGCAG CACCAAGGGA GCCTGGACAG AGGAGCCGGC 7 56 0 

CTGGGCCTGG GGGAGGGGAG GAGGGCCCTC CAGTGCCTTC CAAACCAGGA GGGGAAACTG 7 62 0 

GCTGCTGGTG ACACAGCCTG GGTGACACGG ATCCCACCTG CCTCAGTCCC GAG C AG AG C T 7 68 0 

GGCTGGCCAC TGGGCAGTCC CTTCCCCAGC CAGCCTGACC CCAGCCTGTA CTCCTTCCCC 7 74 0 

CTCCGTGGGG GAAGCTCCGT GGCTTGGCGT CCCCGAGAGC TGCCAGAAAC TAGGATGAAA 7 80 0 

GCCATGGTGA GCACGGCCTC TGTTCCCCTG CACCATTTCC TGGGGTGTCC GGATTAACAA 7 860 

GCTCATTTGA TCTGGTTACA GTGAATTTTC TTCAAAGAAA CACTCAATAG GGTCCCTTGT 7 92 0 

CAGAGTGCCT CGCAGCGACA GTGACTGGGT ACTGCTGCCT TTGTCCTGCC ACCGTCAGAC 7 98 0 

GGGGCTGGCT ATGGGAGGCA ACCAAAGACA TCCCGCACCT GCCCTGGGAG CCTTTCCCTC 8 04 0 

CTCCAGGGCT CAGCCACCTC AGG CGGCCTT CCGTCTGTGT GTCCTGCCAC CCCCGAGATG 8100 

TCCCAGAGGC CACGGTCACC CCATCTGTTC CTGTCCCCAG AACCTTCTCC TGGAGCCAAG 8160 

TATCTGCAGG GACAGACAGG CGAGCGTCTG GGGGTTTGGT GTTGGGGTGG AGAAGGCTGT 8 22 0 

GGGGTGCTGC CCCAGCCCAG GCAGCCTGAC TGTGAGAGCC C CAAAC AGG A GAGCCCCAAA 82 80 

CAGGAAGGAC CAGGGCCCTT CCCCTCCCCT CCATGCTGCC CACCCTCTGA GGAGCAGTGG 8 340 

CCAAGTTCCT CTCTGGGCTT CTCGGGCCAG GCTGACCCTG TCCCCCAGGG CCTCCCACGA 84 0 0 

AGCATGGGAG CTGTTCCCTC ACAGGCAGCA CAGACCCGGA CGGACACCTG TCCCTATGTC 84 6 0 

CCAGCGCCCC CAGGCCCCAG TGAGGAGTAG CCAGGGGGGT GAACAAGGGG GTTCCTGCTG 852 0 

CCTGGGCTTG TTTGGGAAGC AGATGCTGGG CTCAGAGTTT CTTCAGAGAG CCTCACCTTC 85 8 0 

CGTGCTGGCC CCAGAGCATG GCGGGTCCCT GGAGCTGTGG AGGCCATGGC AGCCCCAGCC 864 0 

CACCCCACCC CATCTGGGGA AGTGGAAACC GTATCCACGA GGGTCAGGTC AGGTCTCTGC 87 0 0 

CTCCAGTGAC CTGGCAAGGT TGTGCCCAGC CAGGACCTGG GCTCAGGCCC AGGCAGCCGC 87 6 0 

CACACCCTAC CCAGAGCTCA GAGAAGGCAG CCCAGCCTTC TCCCCACACC AGTCACACCG 882 0 

ft 

AGCCCCGCGT CTGCATTCAC TCCTTTAAGG AACATGGTTG ACTGAATCCG GTGCCGCGCA 88 80 

TTCACAGGAT GGCTCTCCAT GGGTCCACTG GGGCCCAGCC TCTTATGTGG CCCCTCGCTA 894 0 

AAAGGACTCA ACAGAAAGAG TGACCAGGCA CCGACCCTCA TCTAAAGGAG GACTTGGCCA 90 0 0 

TTCCCTGGGC TGTCCCACAG CACCTGCCGG CCAGGGCCCG GGCACAGAGC GAGACTGTCT 90 6 0 

TTTCCTCAAG GAGACACCGT GGGGGAGGGA GGGAGAGGTA GACACCACCA ACCTCATTCC 912 0 
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ATGACCAGGG CCTGGCGATG CTCAGAAGCC AGTGAGTGTG TCfcCTfccC^ Gii^GGGTKAG**r 91§P* 

TGCTGGCCCC CTGGACCTAG GGGGAAGATG GTGCAGGCAG TGGCCCAGCC TGAGGAAGGA 9240 

GCTGAAGCTC TCAAGAGTTT GCAGCCACCC TCCTGGGGAG AGACTGACGC CTCCCCAGTT 93 00 

CCTGTTAGGA AGGACCTCAG GAAAGAACTG GAATTACACA GCCTGGGGTG GCAGCCTCCT 93 60 

GGTCCCTGAG GAGGATGTCA GGCCGCAGAA GGGAGGAACG GGCATGAAGC TTGGGAAGCG 94 2 0 

GGCGCCAGAG GAGGCGAGGC CTCTGCAGAA GCAGCACCAG AGGCCACTGC AGCGGCTCCA 94 8 0 

CCACCCAGCA GCGCCGCCAG GAGGCAGGAA GTGGGAGGCC AGGCAGGAGG GGCTGTGATT 9540 

GCCCAGGTGC CAGGAGGAAG GGCTGAGAGG GGACAGTGCA GATGTCCAGA GAGGCCTGAC 9600 

AGGGACAGGC TGCGAAAGTC ACGGGTGGGG ATGGGCTTCC GCCAGAGTTG TGTGTGGCCT 9 6 60 

G AGG AC AG TG CAGCAAGGAG GCCCCATGGT GAGCACATGC AGCCGAAGTG ACAGGTTGGG 9 72 0 

CTCCTTTGTG GGACAAGAGC CTCTCCAGGC CACTGCAGGG TGTTCAGAGA ACAAGGCCTA 97 80 

CAAGGATCTG CTGTGCCTGC AGCTGGGCAG TAGAACACTG AGCATGCAGG GCCGGGGTGG 9 84 0 

GAAGCAGGAA AGCCACATGG ACGAGAGAGC CGGGCCTGCC CAGCAGTGCC TTTTGGGAGC 9 90 0 

GCAGGCAGGA TGGGATGTGC AGCTGTGACC TGCCCGGCAT AGAACTCCGT CTGGCTGGGG 9 96 0 

AGAGGAGGTC TCTTCTAGCC AGAATGGACC AGGAGGTCCC GGGAGGACCT GGGAGGAAGT 10 02 0 

GGATTGAGTT GGGCCTTAGA AGGAGAGCCA GGAACAGGCC AGGTCAGGGG AGCTGGAGCC 10 080 

TGGCTAGGTA TGGAGAGAGC AGGGTACACT TGCTGCAACT GTGAGAAGAG CCAGGGGTGG 1014 0 

CCCTGGTGGC CTGGGCGCGT TTAGCTGTGC CTGGGGCCAG GCCTGACTGG CTGCAAGTCA 10200 

TTACTATAGG CGGAAAGTGC AGAGTAGCGC GCTCCTGCTG TCACTCCCTC CTCCAAGTCC 10 26 0 

ACAAAGAGGC AAGAAAGGGA GGATTTTAAG GCCTATCCAT ACCGCATGGC AGGTGAG AG C 10 32 0 

AGAGGAGCAA ACAGCACTTT TGGATCCTGG AAAGCAGAAG GTGAGTGTCC CAGGCGTAGC 103 80 

TGACCTGAGA AAGGCGACTC CAAAGCCAGC AGCAGCAACA GCTGGAACTG CCCCAGCCTG 1044 0 

CACCACGGGA CCCCCAGCTC TGAGACTGAG AGCAGCTCTG GGGACCTCTG GGCTGGGGTG 10500 

AAGAGGGATG GCTGGAATCA TTGTTGCAAA CAATTCAGTA GGCAGGCAGC TCCCTAGATC 10560 

CCACCGTGGT CTGCAGAGGC CAGCACCTGT CCCGACCTCT TACTGGTCGG CCCTGGAGAG 10 62 0 

CCATCTCCTA CAGAGGCAAA ATGAACGGTC TCTGGGCCAG GACCAGGCCT GTTCAGGGGG 1068 0 

ATGTGTGGCT AAGTGCATAA GGGATGCTGA GACTACAGCC CTCGTGCCCA GGCAGCGCTC 1074 0 

AGGGCATGGA TAGCCAGGCC CTCCCCATCC AGG CC AG AG A TGGGAAGACT CCATCCAATC 10800 

TCATTCCATG ACCAGGGACT GGCAAAGCTC TCAGTTCTCT CTCCATCCCA GCAGGAGACA 10 860 
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AAGAACCCAA CCTCAGAGAT TCCTCAACTC GGAGACCCAG CjCAGpC^ACt'C^CCAt^GCS?" 10?2"0 ..* 

TCTCAGTCTG CAAGCCCCTT GGTGTGCTCA GAGCTTCCAG TCACACTGCT CATGCCTATC 1098 0 

CGTGCACAGC CAGGGATTGC CCTTCGTGGA GGAAAACTTC AT G AAAC AAA AAACAAGCTC 11040 

CGTGGGGAAC ACAGACCATA GAGGAAAAAG AAAGCTGTAG AAAAAGAAAT GATGAATGCC 1110 0 

TTCCTGGAGG TGAGAAAGCC ATCGTGAAAC GAGAGGAGGT TGCTCCAAAA AGTTCCTAGA 1116 0 

GAGCAAAACA AGGGCCCTTG GAGGCACAAT GATTGCCACC GTGGAGACAC ATTTCAGCGC 112 2 0 

C AC T AG AGT A AAAACACTGC AGACAGGTGA GCTCTCAACA GATACATGTC CCTCGCCTTC 112 8 0 

TCAGGAAAGA TGGGCAGTAA TGAGGGCAGA AGCCACAAAG AGGAAACCGT AGTGACAGGA 113 4 0 

CCCAGGGTCC TTCAAGCTGC GGTGGGGCAA GCGCTCGGGA CAGTGGTGAG GGAGCAGCTC 114 0 0 

AGCCCCAGGT GGTGCCTGGC AACCCGCCCC GGGACGTCCC ACCCAGGGCA GCAGTAGAGT 114 6 0 

GACATGGATA GAAAGCTGAA TTCCCCAGAA GAGCCTGGAG GACATTGAAG TACTTCGCAT 115 2 0 

AGAGCCTCGG GTTGGATTAG TAGTACATAC AGAATGATCC ACATGTGAAG ATAAGACCAT 115 8 0 

GATTGGCTCC AGAGAAAACA GCAGTGCAAG CAAGAAGAGG TAGCTAGTCA CAGTTTACGA 1164 0 

TCTGGCAATA GCGTTTACAC AGTCATCACC AT AG AAATG C CGAGTCAGGA TCTAGTTTAC 117 0 0 

TGCAGAACTC TAT C AG G AGG ACTGGAAGAT GGGGACGCTG TCCACATGCA GGGAATGCAG 117 60 

TTGGTGAAAT GGAAGCTAAA TGCTCATTTT CCTCAGTGGG AAGCTGTGGC TTGAAGATGA 118 2 0. 

CTGTAAACTC TCTTTCCGCC TCTTCAATCT TGACAGGCCC CAGGGCTGCT AAGCTAATAT 118 80 

GGCAGAAGGG ACACTGTGCC AGTTGCAGGC CCAGGCCTTA AGAGACTGGC AGCTTCCCCT 11940 

CTCTGTCTCT G G AAAC C TAC CTGCCCTTCT GTAAGGAAGC CCAAGCAGCT CTGGAGAAGC 12 00 0 

CCTTATGGAG GGGCCCACTC TCAGCCCACA GCCAGCACCA GTTGGGCAGC CACGCAGACC 12060 

CCCAACCTGC AAGCCAGGCC CGCTGAGGCC TCAGTACACA CAGGCAGTCC CATCAGCCCT 1212 0 

GCCCAGATGG CAGTTTTGTG ATCAAAATAT AGACGATAGA TGATTGTTTT TTAAGGTTGT 1218 0 

TGGGGGTAGT TTGTCACACA ACGATAGATA ATAGAACATC AGTAGGCTGT GTGTGTGTGT 12 24 0 

GTGTGTGTGT AG CAT AT ATA TATACACATA TACATATATA CACATATACA TATACACATA 123 00 

CACATATATA CACGTATACA TATATACACA TACATATATA CACATATATA CACATACATA 123 60 

TATACACATA CACATATATA CACATACACA CATACACATA TACATATATA CACATATATG 12 42 0 

CATATATACA CATATATACA TATATACACA TAGCTTCAAA TTCAGACATG AAGAAGTATC 124 8 0 

TTATTTAGCA ACAGTGGTAA ATAGTAAAAC AC C AAG AG AG AGGAAAGTGG TTGCCTCAGA 1254 0 

GATGGGAAAA TGCAAGGAGG GAGACGGAAC TGCTGTTTGT TTTAACAAAC CTTGTAGATC 12 600 



92 



•••• * 

• •» ••»* 
• • • • • ••• • ••• ••• 



TGTTTGATAC TTTAAACTAC ATTCACATAT AACTTGGACA A&AGt "(JIGAAGTJTjA* ! * 12 6.6,0" ».' 

AAAAAATGTA TTCATGCTAA TAGCACAGGA ATGATCCACA ATTGGATTCC AAGGCTTCTT 12 720 

GTACATTCAG CATAGGGTGT ATGAAAGAGT CCACTATTCT AGCAACAGAT AAAATTCCTA 12 73 0 

CTGACACGCA ACCTCAGGTT CCCACTCGTT TAGAAGGCTG CGTATGGTCT TCTACTTAAA 12 84 0 

GCCTCAAGTA GCAGTCATGG C AG TG AC AAA TCCTCATTGC CTCCATAGAA CCTCTAGGCT 12 90 0 

CATGTGTGAG CCCAGGCTGG GCTGGGGCCC CTGGGAGCCC AGGGTGAGGG GCCAGTCCCT 12 96 0 

GGGCAGCTCC GTGAGCCAGG AGCAGCTGTG CCACCTGGGG AAGGGCTGCA CGGTCGATGG 13 02 0 

GTCTTTTCTG CAGAAGAGTG TGCCCCAGCC CTTGCTGGGC ACAGATCAAA GAGGTGTTCA 13 08 0 

TGGGTCGAAA TCACAGATTT CAAGGGCTGA TAGGAGTCAG AGTGGGGGGG CTGGGAGGGC 1314 0 

TGAGGCAGGT TAAAGATTTG AGAGGGGCTG CTGTGTCCAC AGCTGCATCA CACTGCTCTG 132 00 

CTGTCCCCTC CATGTTCCCC GGCACTGCCG CCTACCCTGG GGTCTTCTGG AAGTAACTGA 13 2 60 

AGGCCCCCTC AACCTGGCTC .ATCATCAAAG CAGACTGTTG ACTAGCTGCA GGCAAATATG 13 320 

AAGAGGCTAT 133 3 0 
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Patentansor ii c h e 



1. Nucleinsauremolekiil umfassend eine Nucleinsauresequenz 
ausgewahlt aus der Gruppe bestehend aus 

(a) Nucleinsauresequenzen, die die in Seq ID No. 2 oder 
die in Seq ID No. 4 darges'tellte Aminosauresequenz 
codieren ; 

(b) Nucleinsauresequenzen wie in Seq ID No. 1 oder Seq 
ID No. 3 dargestellt; 

(c) Nucleinsauresequenzen, deren komplementare Sequenz 
mit den unter (a) oder (b) genannten Sequenzen hy- 
bridisiert; und 

(d) Nucleinsauresequenzen, die von den unter (c) genann- 
ten Sequenzen aufgrund der Degeneration des geneti- 
schen Codes abweichen, 

wobei das Nucleinsauremolekiil ein Protein codiert, des- 
sen Inaktivierung in Tieren zu einer Verlangerung der 
Knochen mit Ausnahme der Schadelknochen fuhrt . 



2. Nucleinsauremolekiil nach Anspruch 1, welches genomische 
DNA ist . 

3. Nucleinsauremolekiil nach Anspruch 1, welches ein cDNA- 
Molekiil ist. 

4. Nucleinsauremolekiil nach Anspruch 1, welches ein RNA-Mo- 
lekiil ist . 



5. Vektor enthaltend ein Nucleinsauremolekiil nach einem der 
Anspriiche 1 bis 3 . 



6. Vektor nach Anspruch 5, wobei das Nucleinsauremolekiil 
verkniipft ist mit regulatorischen Elementen, die die Ex- 
pression des Nucleinsauremolektils in prokaryontischen 
oder eukaryont ischen Zellen gewahrleisten . 
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7. Wirtszelle transf ormiert mit einem Nucleinsauremolekul 
nach einem der Anspriiche 1 bis 4 oder einem Vektor nach 
Anspruch 5 oder 6 . 



Verfahren zur Herstellung eines Proteins, das von einem 
Nucleinsauremolekiil nach Anspruch 1 codiert wird, wobei 
eine Wirtszelle nach Anspruch 7 unter Bedingungen kulti- 
viert wird, die die Expression des Proteins erlauben, 
und das Protein aus den Zellen und/oder dem Kulturmedium 
gewonnen wird. 

Protein codiert durch ein Nucleinsauremolekul nach An- 
spruch 1 oder erhaltlich durch das Verfahren nach An- 
spruch 8 . 



10. Antikorper gegen das Protein nach Anspruch 9. 



11. Nucleinsauremolekul von mindestens 15 Nucleotiden Lange, 
das spezifisch mit einem Nucleinsauremolekul nach An- 
spruch 1 hybridisiert . 



12. Diagnost ische Zusammenset zung enthaltend ein Nucleinsau- 
remolekiil nach einem der Anspriiche 1 bis 4, einen Vektor 
nach Anspruch 5 oder 6, ein Protein nach Anspruch 9, 
einen Antikorper nach Anspruch 10 und/oder ein Nuclein- 
sauremolekiil nach Anspruch 11 . 

13 . Pharmazeut ische Zusammenset zung enthaltend ein Nuclein- 
sauremolekiil nach einem der Anspriiche 1 bis 4, einen 
Vektor nach Anspruch 5 oder 6, ein Protein nach Anspruch 
9, einen Antikorper nach Anspruch 10 und/oder ein 
Nucleinsauremolekul nach Anspruch 11 und gegebenenf alls 
einen pharmazeutisch vertraglichen Trager. 




14 . Verf ahren zur Herstellung eines transgenen nicht- 
menschlichen Tieres, wobei ein Nucleinsauremolekiil nach 
Anspruch 1 oder ein Vektor nach Anspruch 5 oder 6 in 
eine Keimzelle, eine embryonale Zelle, eine Eizelle oder 
eine davon abgeleitete Zelle eingefuhrt wird und aus der 
so transf ormierten Zelle ein transgenes Tier erzeugt 
wird . 




15. Transgenes nicht-menschliches Tier, das transf ormiert 
ist mit einera Nucleinsauremolekiil nach Anspruch 1 oder 
einem Vektor nach Anspruch 5 oder 6, oder das erhaltlich 
ist durch ein Verf ahren nach Anspruch 14 . 

16. Transgenes nicht-menschliches Tier, bei dem die 
Expression eines Proteins nach Anspruch 9 in den Zellen 
im Vergleich zu Zellen eines entsprechenden Wildtyp- 
Tieres verringert ist. 



17. Transgenes nicht menschliches Tier nach Anspruch 16, 
wobei mindestens eine genomische Kopie eines Gens, das 
einem Nucleinsauremolekiil nach Anspruch 1 entspricht , 
inaktiviert ist . 

18. Transgenes Tier nach einem der Anspriiche 15 bis 17, daf4 
ein nicht- mens chlicher Sauger ist. 

I 

19. Transgenes Tier nach Anspruch 18, das eine Maus ist. 



Zusammenf as sung 



Nucleinsauremolekule, codierend Proteine, die die 
Knochenentwicklung beeinflussen 



Beschrieben werden Nucleinsauremolekule codierend Proteine, 
die die Knochenentwicklung in Saugern beeinflussen, ebenso 
wie die codierten Proteine, Antikorper und pharmazeutische 
und diagnostische Zusammensetzungen . Ferner werden transgene 
Tiere beschrieben, die die beschriebenen Proteine exprimie- 
ren, und Tiere, bei denen das entsprechende Gen inaktiviert 
ist und die eine Verlangerung der Knochen aufweisen. 



Figur 1 
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560 570 580 

SC-Dis3 DI DDALHAKKLPNG NWEVGVHI ADV 

Spoml.prot DLDDAVS CRALDNG TYEVGVHI ADV 

CE DLDDALHAKHI DDCDGKGTPGLEI GVHI ADV 

HS 

MM 

Lactococ -------- 

590 600 610 620 

SC-Dis3 THF VKP GTALDAEGAA R\G T S V ,'Y L VDKRI D ML' 

Spoml.prot THFVKPDS ALDKEAAS RJA TTVYLVQKAI P ML" 

CE TFFLKEGTELDKWASE 'r'G NSTYL'SQTVIPML 
HS 

MM LGRS K V A A E R|A T S V-V.LVQKVVPML 

Lactococ - -------- 

630 640 650 

SC-Dis3 P'MLjLGTDLCS L t K P YVDRF A'F S,VI WELDDS A - 

Spoml.prot (P 5P L 'L C E R L C S L.'N P N V E R L A'F S ?V F WK L D S N G K 

PiRI tiCEQLCSLNPGVDRLSFST VFKMS YEA- 
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LacWcoc 



'P"R L L C E E L C S L''N P.'MT D K L T FjS ! V I WK L T P E G 



660 670 680 

SC-Dis3 NI VNVNfF MKS VI R S R E A F S ,Y!e Q A QL R I DD - - 

Spoml.prot E I G K R Wf'G KTVI'KTCARL A'Y 5 S EAQGVIJG - - 

CE ELYDVWF..GRS VJ.RSRVKLAY;EH A.Q D F I ;E N P E 
HS 

MM K I L E E WF.'G RTI I^RSCTKLS YjD H A Q S MTE NP T 

Lactococ ----- 

690 700 710 

SC-Dis3 - KTQND ELTMGMRA'LLKLS 

Spoml .prot KSWDDAVGKPI GGTHTPKDVETS I LTL.CEI S 

CE KDFTCDELPDI SDGNTPFEI KEKTL M,L ; H R I A 
HS 

MM EKI PEEELPPI SPEHSVEEVHQAVLN L,M S I A 

Lactococ --------- 

720 730 740 

SC-Dis3 V K L ,K QKRILE AGALNL AS P EVKVHMDS ETS DP 

Jfepoml.prot RKLjRKD R. F AKGAVEI NSTELKFQLDEYGM- P 

^a^^- QVI;RQK:'R:EDS GALRI ELPRLKFALDEDKK - P 

kqIrrqr,- - - - 



750 760 770 

SC-Dis3 NEVEI KKLLATNSL VEEFMLLANI SVA^RKlSY 

Spoml.prot NKCEVYEQTDANHLJ EEF MLLANRS VAE HIS 

CE QGVSI YEI KDSNKLVEEFMLT, ANMEV A K K I A 

HS I H 

MM, F V D G A L R L;D Q E F ML L A N)M A Y A H K I„F 

Lactococ --------- 

780 790 800 

SC-Dis3 D A JF PiQ TAMLRRHAAPPSTNFEI LNEMLNTRK 

Spoml.prot KNJr^S NNS LLRRHAS P'KE K Q I NEFCHFL - KSM 

ce e n f y\e h a l l r n hp ppkekmi k dv a e q c - a r i 

hs. rafpeqallrrhppp:qtrmlsdlvefc-dqm 

mm r t ,f,.p :eqallrrh,pp'pqtkmlsdlve'fc - dqm 

Lactococ ----- N S D.S H Q A I N F F A 

810 820 830 

SC-Dis3 NMSI SLES'SKALADSLDRCVDPED - - PYFNT 

Spoml.prot N F D F JD;A ,SL S^S A A'F NAS MVRLRS TFN - - EELVE 

CE GFPLD'GRTSGL'LSTS L-R KYQGKS RLDMCI RQ 

HS GL P V,D,'F S S'A GALNMALYFCSG - - - - - - - - - - 

MM G L P M;D„V[S S jA G A L jN MALiY FCSG---------- 

Lactococ DEI KGTS S E K ALT Y Q L;R H T MS T - - - - 
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Figur 2b 



840 850 860 

SC-Dis3 LVRI MS TRCMMAAQYF YS - GAYS Y P D F R II V (I 

Spoml.prot LF ENMAVRS LNRAE YF CTGDF GEKTDWHHYA 

CE VI SSLTI KPMQQAKYFCT - FEMPLSFYHHFA 

HS --- --- LLQDP AQF RHYA 

MM - - - - - - MLQDQEQFRHYA 

Lactococ AVYSEKNT K>H„F G 
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